OPS(Old People's) Agent

背景：toB 系列产品，旨在为老年人提供便捷、安全的智能生活体验。OPS Agent 致力于提升老年人的生活质量与安全性。

概述

💡 OPS Agent 是基于mofa-ai框架设计与打造，专为老年人设计的智能助手，遵循成为老年人的守护者的初心，为其提供覆盖记忆、健康、天气三大类型的核心服务。

核心功能

记忆：帮助老年人记住重要信息，如用药习惯、亲朋的联系方式等。
健康：实时上报心率数据, 进行信息整合和处理分析。
天气：提供实时天气信息，帮助老年人合理安排出行和活动。

创新设计

自然语言交互：老年人可以通过语音或文字与OPS Agent进行交流，无需复杂的操作。
硬件集成：通过蓝牙BLE协议与MiBand6手环设备进行集成, 实时上报健康数据。
向量数据库：应用北京智源研究院BAAI/bge-small-zh-v1.5模型和向量数据库存储和检索，确保记忆的准确性。
中心调度节点：ops-scheduler 作为中心调度节点，与记忆模块, 智能硬件设备, 天气MCP服务无缝对接。

关键数据流说明

🌳 OPS Agent系统通过中心调度节点(ops-scheduler)协调各模块：

接收用户输入（语音/文本）
分发请求到记忆/天气模块
与智能硬件设备交互

详细数据流图请参考：OPS Agent 数据流图

(注：使用ASR和TTS功能, 请参考ops-agent-asr-tts目录, 架构图请参考：OPS Agent ASR TTS 数据流图)

mock-voice替换成real-voice[ASR + TTS], 实现语音输入输出功能.

安装与使用

v0.1 终端输入输出版本(模拟语音)

🚀 快速开始

版本0.1, 语音输入输出功能用terminal去模拟, 用于演示OPS Agent的核心功能，包括记忆、健康、天气三个模块。

# 准备框架
pip install mofa-ai
# 蓝牙BLE协议采集
pip install bleak

# 准备ops agents
git clone https://github.com/yangrudan/OPS-agent.git
git checkout release/mock-voice
cd examples/ops-agent

# 配置.env.secret文件(内容如下)
# LLM_API_KEY=sk-xxxx
# LLM_API_BASE=https://api.moonshot.cn/v1
# LLM_MODEL=moonshot-v1-32k

dora up
dora build ops_agent_dataflow.yml
dora start ops_agent_dataflow.yml

# 另一个终端
mock-voice
李爷爷 吃药时间

运行结果

v0.2 VAD+ASR+TTS版本

总体流程与v0.1版本一致, 增加语音识别和语音合成功能, 实现语音输入输出.

# 准备框架
pip install mofa-ai
# 数据库
pip install sentence_transformers
# 蓝牙BLE协议采集
pip install bleak
# asr
pip install websocket-client==1.4.2
pip install pyaudio
# tts   
pip install gradio_client
pip install simpleaudio

# 更换路径
cd examples/ops-agent-asr-tts

# 启动
dora up
dora build ops_agent_asr_tts_dataflow.yml
dora start ops_agent_asr_tts_dataflow.yml

运行结果

开发者指南

OPS Agent目前包括7个agent, 目录结构如下, 可以陆续扩展更多的agent模块:

./
├── agent-hub
│   ├── ops-llm-agent  # 大模型整合信息
│   ├── ops-mem  # 记忆模块(记忆的存储和搜索)
│   ├── ops-miband  # 小米手环心率获取
│   └── ops-weather  # 根据经纬度获取对应的天气信息
├── docs # 文档资料
│   ├── challenge
│   ├── clean.md
│   ├── dataflow.png
│   ├── mock-voice-v0.1.png
│   ├── ops-logo.jpg
│   ├── ops-scheduler.md
│   └── tts_service.png
├── examples
│   ├── ops-agent # mock-voice数据流运行目录
│   ├── ops-agent-asr-tts # real-voice数据流运行目录
│   └── test_llm
├── node-hub
│   ├── mock-voice  # 终端模拟语音输入输出
│   ├── ops-scheduler # 调度模块
│   └── real-voice  # ASR TTS 实时语音输入输出
├── out
│   ├── dora-coordinator.txt
│   └── dora-daemon.txt
└── README.md

难点和突破

问题1: 开启蓝牙广播后, 小米手环获取心率数据为0xff(255)

问题1

解决方式1: 通过开启运动模式, 获取心率数据正常

解决方式1

问题2: 模糊搜索(下图🔍附近为搜索结果)

老年人搜索习惯是 “用简化关键词找具体人 / 事”（如 “奶奶” 对应 “王奶奶”），这类匹配的语义相似度通常在0.5-0.6之间。若坚持固定的阈值，会过滤掉合理结果, 李爷爷用药时间匹配成功, 但是对奶奶进行搜索, 未匹配.

问题2

解决方式2: 基于一些模糊的表达, 动态调整阈值(demo自测ok, 待整合到agents)

解决方式2

问题3: 本地基于CPU侧部署的FunASR的speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online 模型的语音识别不准确, "你好"会识别成"杭", 有时候未识别.

问题3

解决方式3: 采用讯飞开放平台提供的语音识别服务

解决方式3

问题4: 调试语音输入功能, 提示错误, 使用pyaudio找不到GLIBC

问题4

解决方式4: 检查系统环境, 更新软链接

解决方式4

感谢

感谢以下项目提供的支持：

贡献

欢迎您的加入，共同为OPS Agent的发展贡献力量！

👋 展望

进行每天的健康数据, 活动轨迹的存储与分析, 提供健康报告.
支持更多场景，如新闻播报, 🎶戏曲播放, 日常规划, 购物提醒等.
支持更多的智能硬件设备, 如智能手表, 👓智能眼镜等.
提高语音识别和自然语言处理能力，比如对方言更好的识别, 以实现更智能的交互.
增强⚠️安全防护机制, 在异常情况下进行一些主动积极的处理方式(如呼叫紧急联系人), 保障老人的安全.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

OPS(Old People's) Agent

概述

核心功能

创新设计

关键数据流说明

安装与使用

v0.1 终端输入输出版本(模拟语音)

v0.2 VAD+ASR+TTS版本

开发者指南

难点和突破

感谢

贡献

👋 展望

About

Uh oh!

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
agent-hub		agent-hub
docs		docs
examples		examples
node-hub		node-hub
.gitignore		.gitignore
README.md		README.md

yangrudan/OPS-agent

Folders and files

Latest commit

History

Repository files navigation

OPS(Old People's) Agent

概述

核心功能

创新设计

关键数据流说明

安装与使用

v0.1 终端输入输出版本(模拟语音)

v0.2 VAD+ASR+TTS版本

开发者指南

难点和突破

感谢

贡献

👋 展望

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages