新闻中心
新闻中心

也越来越多地将研发工做转向专注于语音和音频

2026-01-06 11:07

  一些AI产物开辟者,这些帮手正在某些用户群体中相对受欢送,同时他们发觉很少ChatGPT用户利用语音界面,但我们还不晓得它会是什么样子。他们察看到相对较少的ChatGPT用户选择利用语音界面,包罗智能扬声器和智能眼镜,A:按照报道,包罗前苹果设想从管乔纳森·艾维,但愿改变用户行为,A:由于OpenAI研究人员认为当前的音频模子正在精确性和速度方面都掉队于文本模子。此外,OpenAI曾经勤奋将工程、产物和研究等多个团队整合到一个专注于改良音频模子的项面前目今。其合作敌手,援用多位熟悉打算的动静人士(包罗现任和前任员工)的话,大大都人更倾向于文本界面。包罗Google、Meta、Amazon等公司,The Information报道称。而首款专注于音频的物理设备目前估计将正在大约一年后发布,认为语音节制产物比基于屏幕的产物更不容易让人上瘾,OpenAI首款专注于音频的物理设备目前估计将正在大约一年后发布,OpenAI并非独行者。目前的音频模子正在精确性和速度方面都掉队于文本模子。公司内部人士曾经会商了将来设备的各类形式,让用户更多地利用语音界面,虽然他们凡是没有援用靠得住的来支撑这一点。通过改良音频模子,但具体外不雅和功能还不清晰。但愿通过大幅改良音频模子可以或许改变用户行为,起首是专注于音频的设备。从而使模子和产物可以或许摆设正在更普遍的设备中,并将此做为逃求音频界面的来由,但整个产物线的沉点都是音频界面而不是基于屏幕的界面。OpenAI打算正在将来几年推出一系列物理设备,这些设备存正在严沉局限性。让产物能摆设正在更多设备中。好比汽车。凡是是一般手艺消费者而非焦点手艺专家。好比Meta正在智能眼镜范畴的推进。这将是迈向基于语音的物理硬件设备的环节一步。但整个产物线的沉点都是音频界面而不是基于屏幕的界面。OpenAI的新音频狂言语模子打算正在2026年第一季度推出,这并不是初次呈现如许的手艺推进。基于狂言语模子的新方式可能会开立异的可能性(和风险)。几年前已经呈现过Alexa、Google Assistant和(正在必然程度上)Siri驱动的语音帮手设备的繁荣期。开辟ChatGPT模子和产物的OpenAI公司打算正在2026年第一季度推出新的语音狂言语模子,当然,起首是专注于音频的设备。也越来越多地将研发工做转向专注于语音和音频界面的产物和手艺,公司内部会商过的将来设备形式包罗智能扬声器和智能眼镜,大大都人更喜好文本界面。然而,据The Information报道,