自己设想中的产品完败,更别提产品都还没做出来。
杰瑞话比较少,直奔主题:“而且,在联网状态下,完美解决了‘鸡尾酒会问题’!”
“鸡尾酒会问题”显示的是人类的一种听觉能力。
能在多人场景的语音、噪声混合中,追踪并识别至少一个声音,即便在嘈杂环境下也不会影响正常交流。
在鸡尾酒会上与朋友交谈时,即使周围环境非常嘈杂,其音量甚至超过了朋友的声音,我们也能清晰地听到朋友说的内容。
若此时,人们的听觉器官突然受到某个刺激,如远处突然有人喊了自己的名字,或者在非母语环境下突然听到母语,即使声音出现在远处、音量很小,我们的耳朵也能立刻捕捉到。
机器缺乏这种能力。
汤姆点头:“我们的产品即使做出来,通过大量数据训练,有信心在识别一个人所讲的内容时,能够体现出较高的精度。
“但,当说话人数为两人或两人以上时,识别精度就会大打折扣。
“在给定多人混合语音信号的情况下,从中分离出特定说话人的信号和其他噪声,我们基本能做到。
“一旦需要同时分离出说话的每个人的独立语音信号…我们,无能为力。”
汤姆语气沮丧:“在我们的设想中,即使再多训练数据的积累和训练过程的打磨,也没幻想过能基本解决‘鸡尾酒会问题’!”
威尔眼神阴鸷:“这款产品我们必须拿下!
“语音搜索、语音翻译、机器朗读、语音导航、语音拍照、语音拨号、语音唤醒、智能语音操控…语音识别技术大有用武之地!
“更何况,维斯顿能真正做到像正常人类一样与其他人流畅沟通、自由交流!
“诸位,仔细想想,语音识别的优势和价值一旦被挖掘、发挥出来,必将对即时通信、购物和搜索等垂直应用产生的巨大影响。
“其中的市场,蕴含多大的利益!”
都是业内人士,知道老大的意思,众人眼神对视后默默点头。
前世,苹果公司的ios手机有siri,谷歌公司的android手机有googlenow,微软公司的windows手机有corana等。
智能语音控制成为进入移动互联网的钥匙,人机语音交互越来越频繁。
老年人视力下降、动作不灵活,低龄儿童一时还不具备手写能力,失明人士无法通过视觉识别事物…
他们都可以通过语音交互给生活带来方便。
以谷歌的实力,语音识别秘密部门聘请的人,自然都是优中选优的高手。
很快,威尔就得到反编译的源代码。
##
#
多更一章,谢谢书友
“虚无湮灭”
“冷漠玫瑰plus”
“端木黯然”
书友
书友
众位大大的推荐票!
感谢“虚无湮灭”大大的评论!