返回文档中心
服务端 Go 语言自研架构

AI语音助手服务端-商业版

项目概述

本服务端是基于Go语言开发的智能语音助手系统,专为商业场景设计,提供完整的语音交互解决方案。兼容小智服务生态,深度适配APP端需求,支持从基础语音交互到高级AI能力的全栈部署。

本项目为深度适配APP V3版本,兼容小智服务。

核心特性

全Go开发、性能彪悍、1:1还原官服体验

1. 核心功能

智能语音交互

  • ASR(语音识别)
  • TTS(语音合成)支持多语言及方言
  • LLM(大语言模型)
  • VAD(人声检测)
  • 声纹识别
  • 音色克隆
  • 记忆系统

记忆系统

  • 短期记忆
  • 长期记忆
  • 声纹识别

2. 商业增值功能

APP付费服务模块

  • 角色更换系统
  • 音色库订阅
  • 语音包订阅
  • 语音克隆服务

企业级功能

  • 用户绑定系统
  • ESP设备绑定
  • 私有化部署

3. 生态扩展

多样服务

  • 本地化 VAD/ASR/TTS/LLM
  • API接入 VAD/ASR/TTS/LLM
  • 声纹识别
  • 记忆系统

视觉增强

  • Live2D商店集成
  • 形象一键更换
  • 模型绑定系统

管理后台

功能模块

  • 用户管理:支持组织架构树管理
  • 角色管理:支持RBAC权限控制
  • 设备管理:支持实时设备状态监控
  • 监控看板:支持CPU/GPU/内存实时监控