第一个能听懂人类语气的AI火了,网友:感觉在和真人交谈

西风 发自 凹非寺量子位 | 公众号 QbitAI
第一个能听懂你说话的语气、有“情商”的AI火了!
请看VCR:
△字幕为机器翻译
这个AI名为EVI(Empathic Voice Interface),它不仅能够能够理解用户的语气,还会为每个词增加意义。
对话中的每句话,它都能可视化含惊讶量、含悲伤量、含兴奋量……
然后根据用户的声音信号来变换自己的语音语调,给出高情商回答。

EVI发布后,网友再次沸腾,称其为“语音交互的游戏规则改变者”。
知名科技博主,曾是微软最著名博客人的Robert Scoble也下场体验了,让EVI讲起了笑话:
△字幕为机器翻译
网友看了EVI的一系列效果后也坐不住了:
除了ChatGPT,第二个让我深感震惊的demo就是这。

还有网友表示自己用ChatGPT语音对话时,就预想到了这样的功能体验,现在想法变成了现实。

确实,ChatGPT、讯飞星火等语音对话都是直接将对话内容转换成文字,语气停顿都不能保留。

知心大姐/哥EVI来了
目前,官方放出了demo,大伙儿可以试玩。
不过由于太火,有时也会出现被挤爆情况。

已经玩上的网友开始询问它各种问题。
比如讨论冬天天气严寒,是否要给楼房建造项目增加隔热材料。
△字幕为机器翻译
有网友用不同语调来测试它,EVI都能识别并变换多种情绪回应。
△字幕为机器翻译
还有网友开始整花活,让两个EVI对话,不断让它们互相打断对话,然后两个EVI都开始“请,继续”、“我洗耳恭听”。

再来看官方的介绍,总的来说,EVI是一个基于自研的具有同理心的大模型“eLLM”驱动的API,4月份将正式发布。
有这么几个特点:
根据你的情绪以类似人类的语调作出回应
针对你的需求,使用能够提高满意度的语言反应
知道何时讲话,利用你的语调精准判断对话轮次结束
若被打断会停止发言,并能从中断点恢复对话
通过分析你的反馈逐渐自我优化,增强你的幸福感

通过申请,开发者可以提前获得开发访问权限,将EVI集成到各种应用中。此外,EVI还可以融合外部大模型API的回应,而demo融入了Claude 3 Haiku。
不少开发者已经在评论区开要权限:

背后公司Hume AI
打造出EVI的,是一家名为Hume AI的实验室/科技公司。目前团队共有30人,已在顶刊发表了超8篇学术文章。
CEO兼首席科学家Alan Cowen是前谷歌研究员。
他的主要研究是利用计算方法来探讨情感行为如何被激发、概念化、参数化、预测、注释和转化。
据了解,他提出的语义空间理论(semantic space theory),是Hume AI用来捕捉和理解人类表达和沟通中复杂微妙细节的数据驱动方法的基础。

此外,Hume AI还有加州大学伯克利分校心理学教授Dacher Keltner助阵,COO是前Ageis Ventures合伙人Janet Ho。
就在几天前,Hume AI完成了5000万美元的新一轮融资。
之前,Hume AI还推出了Expression Measurement API,一个用于测量人类情感表达的高级工具包,以及Custom Models,它使用这些测量的迁移学习来预测人类的偏好。
那么对于新发布的EVI,你觉得它的效果如何?
参考链接:[1]https://x.com/hume_ai/status/1773017055974789176?s=20[2]https://x.com/hume_ai/status/1773418096499257528?s=20[3]https://x.com/AviSchiffmann/status/1773070097210335336?s=20[4]https://x.com/catherineols/status/1773222122430550336?s=20[5]https://x.com/mohakmangal/status/1773187272881357192?s=20
— 完 —
【🔥 火热报名中】中国AIGC产业峰会
定档4月17日
峰会已经邀请到数位代表技术、产品、投资、用户等领域嘉宾,共论生成式AI产业最新变革趋势。
最新确认嘉宾包括:商汤科技杨帆、轻松集团高玉石、印象笔记唐毅、蚂蚁集团李建国等,了解更多嘉宾详情。
点击报名参会 ⬇️ 

峰会将全程线上下同步直播,欢迎预约直播 ⬇️
点这里👇关注我,记得标星噢
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~ 

到顶部