Arena Score
13984
9,200 次投票
音频 分类 · Rank #7
核心亮点
情绪识别
53 种情绪维度实时输出,业内最细
共情声调
根据用户情绪调整语速 / 语气 / 停顿
端到端语音
语音 LLM 直出,自然打断 + 追问
低延迟
约 500ms 端到端,适合实时陪伴
可接 LLM
支持 Claude / GPT 作为后端推理
伦理设计
团队来自 Hume 情感研究,合规严格
适用场景
推荐4 项
- ✓心理陪伴 / 情绪疏导应用
- ✓教育 / 儿童辅导(情感敏感场景)
- ✓客户体验 / CX 质检(情绪分析)
- ✓医疗辅助问诊(共情优先)
不推荐3 项
- ✗标准 TTS / 朗读(ElevenLabs 更自然)
- ✗通用 Agent / 工具调用(OpenAI Voice 更强)
- ✗音乐 / 歌唱生成
vs 同类竞品
细分 Benchmark
来源:厂商公布 / 第三方评测
情绪表达96 / 100
共情回应94 / 100
情绪识别精度93 / 100
对话自然度89 / 100
端到端延迟86 / 100
用户偏好88 / 100
定价方案
Free
$0
每月 10,000 字符试用
Pay-as-you-go
$0.10 / 分钟
按量计费
Enterprise
联系销售
SLA · DPA · HIPAA
规格参数
每分钟
$0.10
支持语言
20+ 种
情感
支持
安全与隐私
数据训练
企业版不用于训练
数据留存
按合同,默认 30 天
情绪数据
严格访问控制
合规认证
SOC 2 · GDPR · HIPAA(企业版)
企业合同
BAA · DPA 可签
同类相关模型
常见问题
Q1Hume EVI 2 vs OpenAI Voice?
OpenAI Voice 对话自然度 / 工具能力更强,适合通用 Agent;Hume 情绪识别与共情表达更细,适合心理 / 陪伴 / 医疗场景。专业情感场景选 Hume。
Q2能识别哪些情绪?
Hume 基于 10 年情感研究,可实时输出 53 种情绪维度(焦虑 / 喜悦 / 沮丧 / 期待等),远超业界 6-8 类的粗粒度标签。
Q3可以接自己的 LLM 吗?
可以,EVI 2 支持自定义后端(Claude / GPT / 开源模型)。Hume 负责情绪识别 + 共情语音生成,推理层由你决定。
Q4一小时通话多少钱?
$0.10/分钟 = $6/小时,略贵于 OpenAI Voice 的 $9/h(含语音 LLM),但 Hume 不包推理,加上 LLM 成本总价可比拟甚至更高。
Q5中文支持如何?
支持中文但情绪识别精度不及英文,共情声调表现尚可。建议重点用在英文场景,中文作为辅助。