|
Post by tanmoysd29 on Dec 13, 2023 5:52:14 GMT -5
相反,属于相似图像组的术语,例如“风暴”和“云”,可以被理解为同义词。由于系统学习单词的含义以及与之相关的图像,而不仅仅是吸收它们的声音,因此该应用程序比标准语音识别方法具有更广泛的潜在用途。 研究人员使用了包含 张图像的数据库,每张图像都有与之相关的口头描述记录。其中一份录音被提供给该应用程序,该应用程序随后检索了与该声明最相符的 张图像。正确的图像出现在 的 个选择中。“我始终坚持认为,我们正在迈出一小步,但我们还有很长的路要走,”格拉斯宣称。“但这是一个令人鼓舞的开始。” 该系统有一个巨大的银行,由 的一位主要研究人员和他的学生准备。使用众包网站亚马逊的 ,人们被雇用来口头描述图像,使用他们能想到的所有短语 秒。 据其创建者称,这种类型的关联内容对于确保系统初始演示取得良好结果是必要的,但最终目标是使用数字视频来训练应用程序,并尽可能减少人工参与。 神经网络 该系统与神经网络配合使用,神经网络是模仿大脑结构的机 手机号码列表 器学习形式。这些网络由处理节点组成,这些处理节点与单个神经元一样,只能进行非常简单的计算,但在密集网络中相互连接。当神经网络接受训练时,其节点执行的操作会不断修改,以提高其在特定任务上的性能。 国立台湾大学电气工程和计算机科学教授李林山说:“婴儿可能是通过对环境的感知来学习说话的,其中很大一部分可能是视觉的。 今天,机器已经开始模仿这种学习过程。“这项工作是这条道路上的首批工作之一,当我听说它时,我印象非常深刻。” 这一创造只是研究人员在学习方面所取得的巨大技术发展的一个例子。社会热切地希望这些发明能够尽快普及到普通大众,让我们的生活变得更轻松。 自从 地图出现以来,我们不知道如何在不咨询该应用程序的情况下从一个地点前往另一地点。我们不再询问街上第一个经过的人,公交车候单道具。我们非常高兴地陶醉在搜索地址的便利之中,并且在不到一秒钟的时间内,我们就掌握了到达目的地的最快方式。
|
|