开元棋盘官方网站 郭家 | 图灵机器人 联合创始人:AI之多模态语义

葡萄创投怎么样_葡萄创投怎么样_葡萄创投怎么样

图灵机器人首席运营官郑勇拥有8年从以色列上市公司到中国初创公司的人工智能经验。

图灵机器人拥有全球人工智能领域最好的中文语义技术。 公司为智能硬件制造商和解决方案提供商提供核心技术,让客户将其产品升级为具有AI功能的智能玩具、智能家居、智能迎宾、智能客服等产品。

图灵机器人联合创始人郭嘉出席葡萄创投主办的2017机器人与人工智能产业发展论坛,并发表“AI的多模态语义”主题演讲。

视频语音录音

1.语义是AI领域的核心瓶颈。 这一观点是AI巨头马文·明斯基所说。 当记者问“是否有任何瓶颈与语义一样重要,但在不久的将来更有可能被打破?”时,马文·明斯基说:“没有。”

2.什么是真正的机器人? 有人需要看起来像那样。

例如,蓝河实际上只是一个智能机器,不能称为智能机器人;

再比如机器人RoBoHoN,每台售价约2万元人民币,在日本已售出3万台。 其对应的场景主要是“男朋友送女朋友”、“父母送孩子”、“老人用”。 ”。

3、“多模态互动”很重要,不仅仅是对话开元棋盘官方网站,还有动作和表情。 通俗的解释是:行动和言语是串在一起的。 其背后的理论基础是“Merabian沟通模型”:有效沟通要素的重要性——言语7%、语音语调38%、动作55%。

今天我想跟大家分享一些人工智能、多模态交互领域的具体事情。 我们在现场看到了我们公司的合作伙伴。 我们公司向业界提供语义技术。 其实在中国,这个领域应该属于大...有些厂家正在和我们合作。 今天我给大家讲讲多模态交互。 图灵机器人专注于语义分析这个领域,以及(PLN、PLC)和其他东西,包括复杂系统拓扑智能。 决策等。我们公司的愿景是让机器理解世界。 我们知道开元棋盘官方网站,人工智能之父在接受采访时表示,最难的技术是语义理解。 记者询问是否有类似困难但短期内可以实现的事情。 难度可就大了,至于第二种技术,他说没有。 在我看来,语义是最重要要解决的问题。 这是20年前的采访。 其实我们都知道,在人与人交往的过程中,它是非常重要的。 信息是通过我们交流中的言语来传达的。 这个过程的重点是我们如何理解决策和表达。 我们公司的理念是不断深入挖掘语义技术,最终让机器理解人、理解世界。 然后我们会跟大家分享一些我在这个领域看到的和我们相关的案例,因为我们做了很多消费机器人。

多模态交互领域相关案例

第一个案例称为“蓝河”。 涉足农业的人都知道,这是美国的独角兽公司。 前年,它说我的目标很明确,就是我要做一种蔬菜,就是土豆。 我想赢得这种蔬菜。 去年的目标是两个品种,一个是生菜,一个是番茄。 这家公司做的事情非常简单。 在拖拉机后部添加注射器。 只要它识别出杂草,就往里面注射一剂化肥。 一石三鸟,肥料除草。 烧死它,然后让周围的农作物长得更好,节省人力。 现在这种方法很流行。 短短一年的时间,这家公司也是一家人不多的初创公司,并且已经实现盈利。 新成立企业超过1000万美元。 我们去跟它交流,说现在流行叫它智能机器人。 您如何定义您的产品以及它属于哪类机器人? 他说我这个东西不叫智能机器人。 它是一种达不到人类水平的智能机器。 你眼中的机器人是什么样的? 他说我们眼中的机器人都是一样的。 当我们第一次对机器人做出反应时,它们是有手臂、腿和头部的人形机器人。 这是我们从小到大从科幻电影中看到的思维意识,但实际上,从学术的角度来看,从人形机器人的角度来看,我们可以将其分为很多类别,而不仅仅是人形机器人。 接下来我们要聊的话题是人形机器人及其发展方向。

第二个案例是“二十一”。 这是日本疗养院大量使用的产品。 它能捡起一根吸管,动作非常精细,只要掉在地上的一根吸管,它都能捡起来,递给手脚有困难的老人。 请问这里的专家,这款机器人的价格是多少呢? 我把它作为反例。 当时的售价为每台120万元。 为什么我拿这个产品作为反例呢? 因为在中国市场,很多时候,其实我们不需要花很多钱让它处理很多事情,或者它甚至不能处理很多事情。 制造人形机器人应该朝哪个方向发展,所以我们提出一个问题。 在这张图中,我们看到了从原始人类到人类的进化过程。 我们看到我们曾经在历史课本上学过这句话,人类和动物最大的区别是什么? 它可以制造工具。 我想说,我们创造出机器人之后,如果它的手不能制造工具,它还能做什么呢? 它的手的功能非常不清楚。 无论是捡西瓜,还是帮助老人,还是抓鸡蛋。 这些领域的研究已经有30年、40年甚至更长时间了,但一直没有做得很好。 那么我们现在来看一下。 如果能达到这个水平,你对人工智能有什么看法? 进入家庭,制造消费产品,按照这个推理,消费机器人的双手无法做任何有实用价值的事情。

葡萄创投怎么样_葡萄创投怎么样_葡萄创投怎么样

机器人产品主要应用场景

我们在想,如果一个机器人没有实用价值,它进入家庭还有什么作用呢? 我们和富士康合作了一个产品。 该产品去年在日本上市半年,销量达3万台。 听起来不多,但就是这个产品2万人民币一个,还是蛮实惠的。 这个产品看起来这样比较大,但实际上它是一个非常小的机器人,只有19.8分。 它使用了世界上几乎所有最小的、最小的激光投影、最小的屏幕等。 几乎都是最小的。它的功能是什么,为什么卖得这么好? 我们仔细研究了日本的数据,发现了主要场景。

第一:男朋友送女朋友;

第二:父母送孩子,主要是这两个场景;

第三:有一些,但不是很大,是给老人用的。 这在日本是一个非常特殊的情况。 日本人口老龄化十分严重。 很多老人无论是在疗养院还是在家里都极度缺乏陪伴。 当然,这还不是最重要的。 最重要的是前两个。

多模态语义交互

富士康来找图灵,说想和你合作创造产品(每周转换)。 我们告诉他们我们还应该提供什么来提供对话功能。 他们说,对话不仅应该是对话,还包括它的动作和表情。 我希望把它们串联起来,我们就想到了很多年前研究的技术,就是刚才提到的多模态交互和多模态语义。 我做出一个动作来表达你和我。 这个动作其实就和我的语言完全串在一起一样。 让我再举一个例子。 我说我把西瓜切成两半,一半给你,一半给我。 这些行动和言语都是串在一起的。

当时,有记者采访了世界领先的人形机器人发明者之一的高桥富隆,问他机器人和手机最大的区别是什么。 高桥智高说人可以和机器人说话,记者说手机也可以说话,比如Siri接着说高桥智高:你见过人跟乌龟、金鱼说话,或者人跟手机说话吗? 在高桥眼里,如果你制造一个人形机器人开元88ky注册送88,或者是一些人性化的东西,它不仅会说话,它的动作和表情也可以给你反馈,就像我们养狗和猫一样,它们可以给你反馈。 ,这是我们做这个产品的理念,Merabian沟通模式,在我们和别人沟通的过程中,纯文字只占7%,语音语调占38%,视觉体占55%。 在我们所有的交互中,其实只有一小部分文本是纯文本。 大部分信息是通过声音、语气、表情和动作传达给对方的。

所以我们做这个机器人最重要的就是要做多模态交互。 这里白色的是来自麻省理工学院的一家美国初创公司制造的机器人,红色的是与图灵合作的机器人(奥飞)。 从数据中可以明显看出,用户与它的交互次数和购买欲望完全是两个数量级,因为如果你告诉用户这是一个机器人,它是非常智能的,我不需要这里给机器人介绍一下。 ,很多人都会购买,感受它的生动。 图灵目前在国内的多模态交互技术至少领先同行业一年,因为大家都知道有公司是做语音交互的,有公司是做视觉交互的,有公司是做语音加视觉的,但是他们做的多模态几乎没有基于身体神经元的输入和输出。

我再举两个例子:我们和周杰伦、杨幂合作的明星机器人。 我们制作的仙儿机僧是与龙泉寺合作的佛教机器人。 我们还是给它很多佛教知识,它会做出一些佛教的表情。 接下来的合作案例是我们目前正在和耶鲁大学洽谈合作。 该模型假设有一个孩子正在玩游戏。 第一张图纯粹是在电脑上学习的。 第二张图中,有一个小鸡会给他不断的反馈,而第三个放了真正的玩具小鸡的小鸡不仅会给他反馈,还会给他动作反馈,比如他做的题是错还是对,并学习关于他在那里的研究。 效率暴涨,这也是我们深入挖掘儿童学习场景的重点。不再做其他广告,谢谢大家

开元棋盘官方网站车祸检测将很快出现在 Galaxy S24
开元棋盘官方网站 伟高达创投亮相第15届中国投资年会·年度峰