快速开始

ESP-AI 是什么？

ESP-AI为你的开发板提供全套的AI对话方案，包括但不限于 ESP32 系列开发板的 IAT(ASR)+LLM+TTS 集成方案。依赖式注入到项目，不影响现有项目。

为什么说包括但不限于ESP32开发板呢？因为即使你的另一块开发板使用的是其他开发板，你也可以用ESP32来基于本项目搭建AI服务，并且使用串口通信方式来将指令或者对话发送到你的另一块开发板。

ESP-AI 能做什么？

我们设想这样的一个场景，你手里有一个机器人，他可以做一些固定的动作，但是你想和它进行交流，并且让它可以理解你的一些指令。如果你要从零开始实现这套流程，那你讲会从收集麦克风的音频流开始，然后进入无休止的调试...

现在有了ESP-AI你大可不必这么做了，你只需要引入ESP-AI即可，对于离线语音唤醒、语音识别、大语言模型调用、文字转语音、喇叭输出音频等流程都已经帮你实现好了，而且ESP-AI使用插件式设计框架，上述中的每一个步骤都提供了扩展方法，让你可以随意定制你的产品。

ESP-AI 技术栈

在软件方面：本项目服务端代码基于 Nodejs，硬件代码基于 Arduino。服务端虽然基于Nodejs进行开发，但是也提供其他编程语言编写插件，详情见插件开发章节。
在硬件方面：本项目主要基于ESP系列的开发板进行运行。

特性

✔️ 可定制的离线语音唤醒词，且内置多种唤醒方式（语音、按钮、串口、天问asrpro）
✔️ 完整对话链接 IAT(ASR) ➡️ LLM/RAG ➡️ TTS
✔️ TTS/LLM 都做了快速响应算法，在考虑服务费用的基础上尽力以最快速度响应用户
✔️ 支持会话打断
✔️ 用户指令识别(家电控制、唱歌等)，并且可以根据上下文动态响应指令
✔️ 配置化
✔️ 插件化，可以利用插件接入任何LLM/TTS/IAT
✔️ 服务与客户端为一对多关系，并且可以为每一个客户端(硬件)独立分配一套配置
✔️ 连接支持鉴权
✔️ 全链流式数据交互
✔️ 开发者平台提供：免费服务、可视化配置 ...
✔️ 客户端配网页面提供
✔️ 轻松应付大并发场景(需配合Nginx做负载均衡)
✔️ 开箱即用

下一步计划

🤔 唤醒精准度提升
🤔 用户意图推理过程加入AI（如：帮我关灯、快开灯，都将识别为: "开灯" 指令）
🤔 唤醒词在线生成
🤔 客户端 OTA 支持
🤔 其他语言编写插件的方法（避免只能使用nodejs进行开发插件）
🤔 外接电源管理
🤔 提供专用开发板（避免当前的复杂接线）

开发环境准备

本地开发环境准备

后续升级仅需在发布页面下载相关文件即可，下面的依赖文件只是首次需要安装。

docker 镜像或者window懒人包安装服务端时不需要 Nodejs 环境。

环境	版本	备注
`Nodejs`	>= v18.x 建议18.x	npm版本需要低于10.x, 6.x到9.x都行
`VsCode IDE`	最新版
`Arduino IDE`	>= v2.x	如果你想用 platformio 来开发客户端，也可以选择 VsCode 等IDE
`esp` 开发板	v2.x	`Arduino IDE` 中搜索安装`esp`开发板
硬件代码依赖库	最新版	需将`Github` 仓库中 `/client/libraries` 中的插件导入到IDE插件中，默认位置在`C:\Users\用户名\Documents\Arduino\libraries`

硬件代码依赖库说明

文件名	备注	版本
arduino-audio-tool	https://github.com/pschatzmann/arduino-audio-tools
WebSockets	新版IDE可以直接搜索安装	v2.4.0
Arduino_JSON	新版IDE可以直接搜索安装	v0.2.0
esp-ai	esp-ai 暂时不可搜索安装
xiao_ming_tong_xue_inferencing	离线语音识别模型暂时不可搜索安装

先按下图中配置好信息，文件就选择下载的 bin 文件，地址填写 0x00
点击 START 按钮即可上传(注意，点击前先关闭其他地方对该串口的监听，比如 Arduino 在监听串口，否则会失败。)

OTA 升级

当 ESP-AI 推出新版本时，您也无需再次烧录，只需要喊一声 检查固件更新 即可，详细效果可以看视频。配置步骤如下：

到开发者平台配置意图命令
重启开发板(按一下 RST 按钮)
尝试唤醒小明同学后，呼喊 检查固件更新 即可。

硬件代码 - Arduino

创建一个文件 example/example.ino ，注意：文件必须放到一个文件夹里，文件夹名字必须和文件一样
用 Arduino IDE 打开 example.ino 文件
写入下面代码，然后上传到开发板中

#include <esp-ai.h>

ESP_AI esp_ai;
 

void setup() {
  Serial.begin(115200);
  // [必  填] 是否调试模式， 会输出更多信息
  bool debug = true;
  // [必  填] wifi 配置： { wifi 账号， wifi 密码 }  注意：要用双引号！
  ESP_AI_wifi_config wifi_config = { "", "", "ESP-AI"  };
  // 用开发者平台，只需要配置为空
  ESP_AI_server_config server_config = { };
  // [必  填] 服务配置： { 服务IP， 服务端口, "请求参数，用多个参数&号分割" }
  // ESP_AI_server_config server_config = { "192.168.1.5", 8088, "api-key=your_api_key&p2=test" };
  // [必  填] 离线唤醒方案：{ 方案, 识别阈值 }, "edge_impulse" | "diy"，为 "diy" 时可调用 esp_ai.wakeUp() 方法进行唤醒

  ESP_AI_wake_up_config wake_up_config = {};
  strcpy(wake_up_config.wake_up_scheme, "asrpro");  // 唤醒方案
  strcpy(wake_up_config.str, "start");              // 串口和天问asrpro 唤醒时需要配置的字符串，也就是从另一个开发版发送来的字符串
  // strcpy(wake_up_config.threshold,  0.95);  //  内置语音唤醒时需要配置 唤醒阈值 0-1
  // strcpy(wake_up_config.str, 10);  // 引脚高低电平唤醒时需要的引脚IO

  // [可留空] 麦克风引脚配置：{ bck_io_num, ws_io_num, data_in_num }
  ESP_AI_i2s_config_mic i2s_config_mic = { 4, 5, 6 };
  // [可留空] 扬声器引脚配置：{ bck_io_num, ws_io_num, data_in_num, 采样率 }
  ESP_AI_i2s_config_speaker i2s_config_speaker = { 16, 17, 15, 16000 };
  // [可留空] 音量调节配置：{ 输入引脚，输入最大值(1024|4096)，默认音量(0-1) }
  ESP_AI_volume_config volume_config = { 34, 4096, 0.4 };
  // 开始运行 ESP-AI 
  esp_ai.begin({debug, wifi_config, server_config, wake_up_config, volume_config, i2s_config_mic, i2s_config_speaker});
}

void loop() {
  esp_ai.loop(); 
}

硬件代码 - IDF

// 开发中 ...

天问唤醒

由于 ESP-AI 2.0 临时下线内置唤醒功能，详情见升级日志，所以想要语音唤醒需要接一个天问模块，或者其他模块都可以。

天问板子如果是核心板需要自行解决 5v 供电，最好外接一个电源，开发板直接插上电脑即可。

接线图

ESP32-s3	天问asrpro
GND	GND
TX/TX0	PB6
RX/RX0	PB5

天问代码：https://github.com/wangzongming/esp-ai/blob/master/client/esp-ai/examples/asrpro-wakeup/voice.hd , 直接下载这个代码，然后用天问Block打开后烧录进去即可。

需要注意下面两个问题：

有的板子 S3 板子插入到右边的c口时可能接收不到天问发来的串口信息，可以换到左边试试。
两个板子的 GND 必须连在一起(共地)。

硬件物料

硬件	数量	价格
esp32s3(N16R8)	1	25
INMP441	1	8
Max98357A	1	5
LED	1	0.5
小喇叭	1	6
面包板	1	5
杜邦线	若干	1
天问asrpro （esp-ai 2.0临时唤醒方案）	1	30

硬件接线 - ESP32-S3

下面的引脚都是 IO 号

下面的 交互灯光 暂未发布，使用官方固件+开发者平台可以抢先体验。

ESP32-s3	INMP441	Max98357A	电位器(可选)	LED(可选)	天问ASRPRO	WS2812(可选)互交灯光
3v3	VDD	VDD	VDD			VDD
GND	GND	GND	GND	GND	GND	GND
GND	L/R
4	SCK
5	WS
6	SD
15		DIN
16		BCLK
17		LRC
34/35			OUT
18				正极
tx					rx
rx					tx
10						DIN

接线图待补充...

继续在上面创建的 example 目录中创建一个文件 index.js
在 index.js 中添加以下代码：

const espAi = require("esp-ai"); 
const config = { 
     gen_client_config: ()=>({
        // 具体配置见服务端...
    })
};
espAi(config);

安装服务端依赖

yarn add esp-ai --registry=https://registry.npm.taobao.org  --strict-ssl=false

npm install esp-ai  --registry=https://registry.npm.taobao.org  --strict-ssl=false

pnpm install esp-ai

运行服务

# 生产环境中请使用 pm2 来运行服务以保证服务的可靠和性能： pm2 start ./index.js -i max 
node ./index.js

Docker 方式安装

我们将容器命名为：esp-ai-server
配置文件放到/esp-ai-server/index.js (请先手动创建好这个文件)
宿主机端口为8088

注意：上面这三个配置只能更改宿主机的，镜像的必须如下写死。

创建配置文件

sudo touch /esp-ai-server/index.js

编辑配置文件

sudo nano /esp-ai-server/index.js

打开后把下面代码复制进去：(记得自己去复制自己的key)

const espAi = require("esp-ai"); 
const config = { 
  // ...
};
espAi(config);

然后 ctrl + o 保存。然后 ctrl + x 退出。

运行容器

必须先手动创建好 /esp-ai-server/index.js 文件，该文件案例在仓库的 example/index.js 目录下。

sudo docker run -itd -p 8088:8088 -v /esp-ai-server/index.js:/server/index.js --name esp-ai-server registry.cn-shanghai.aliyuncs.com/xiaomingio/esp-ai:1.0.0

配置文件将映射到了/esp-ai-server/index.js，需要自行更改配置文件，更改文件后重启服务即可：

sudo docker exec -it esp-ai-server pm2 restart all

容器内安装插件

直接在容器内执行安装插件的命令

sudo docker exec -it esp-ai-server npm i [插件名字]  --registry=https://registry.npm.taobao.org  --strict-ssl=false

然后自行修改配置文件后，依然需要重启容器

sudo docker exec -it esp-ai-server pm2 restart all

查看运行日志

sudo docker exec -it esp-ai-server pm2 logs

更新依赖

用最新的版本号替换下面代码中的版本号即可。

sudo docker exec -it esp-ai-server npm i esp-ai@1.xx.xx  --registry=https://registry.npm.taobao.org  --strict-ssl=false

更新完毕后需要查看package.json中的版本号是否正确，如果正确，则重启容器即可。

sudo docker exec -it esp-ai-server cat ./package.json

快速开始

ESP-AI 是什么？

ESP-AI 能做什么？

ESP-AI 技术栈

特性

下一步计划

开发环境准备

本地开发环境准备

硬件代码依赖库说明

讯飞 KEY 申请

客户端

官方固件烧录（零代码，不搞环境）

下载烧录工具

下载 ESP-AI 固件

上传固件到开发板中