自建语音 / 视频转文本服务

基于 SenseVoice 模型，支持中/英/日/韩/粤五种语言。数据全程留在你的服务器，通过 API 供其他项目调用。

在线试用 API 文档

上传 MP3/WAV/FLAC 等音频文件，返回识别文本和时间戳分段。支持超长音频自动切分。

上传 MP4/MKV/MOV 等视频文件，自动提取音轨并转写。原始视频不保存，只留提取音频。

粘贴链接自动转写。官方字幕优先几秒完成，无字幕自动走 ASR 兜底，同时生成 MP3 永久保留。

通过 WebSocket 发送 PCM 音频帧，VAD 自动分段，逐句返回识别结果，延迟 ≤ 3 秒。

API 速览

所有请求需携带 Authorization: Bearer sk-xxx 头。在管理后台创建 API Key。

curl -X POST https://asr2.llll.im/api/v1/audio/transcribe \
  -H "Authorization: Bearer sk-your-api-key" \
  -F "file=@recording.mp3"

API Key

Key 会自动保存在浏览器本地，下次无需重复输入

音频 / 视频文件

点击选择或拖拽文件到此处

识别结果

选择模式后开始试用