神仙打架!OpenAI和Google發佈“能看到”的語音助手

這兩天OpenAI和Google都發布了最新的大語言模型。
兩家公司近乎同步地解決了推理速度的難題,讓聊天機器人的響應沒有時間差(幾乎)。
OpenAI發佈了GPT-4o,更快更強,支持多模態;
Google發佈了Gemini 1.5 flash,比pro更快,還支持100萬超長上下文。
新模型帶來了更多更強的能力,其中最吸引人的,則是“能看到”的語音助手,能實時看到、理解、回覆,就像漫威《鋼鐵俠》裏的賈維斯。
GPT-4o
先來看看GPT-4o,OpenAI公開了很多演示視頻,我覺得這個最有代表性,就像是你的好友,情感充沛。
Google Astra項目
Google給這個助手起了一個高大上的名字:Astra 項目。受益於其超長上下文,可以記住剛剛看過的畫面,幫你查找某件具體的東西。

(視頻被谷歌黑板報聲明原創了,沒法加字幕,可以點擊文末“閱讀原文”移步B站看字幕版)
寫在最後
最近OpenAI跟蘋果已經達成合作了,要將GPT接入到iPhone替代Siri;Google也正在將Gemini跟其安卓生態、Pixel設備進行深度融合。
如果去年是生成式AI元年,那麼今年就一定是語音助手快速更新換代的一年。各種各樣的移動設備、智能硬件將馬槍換炮(更準確來說應該是換心),不再是人工智障。
AI將不僅僅能提高效率,而是真切地爲你的工作、生活提供幫助。
希望中國公司不要落下太遠。

以上,如果覺得內容還可以,求點贊、在看、關注。