導(dǎo)讀 谷歌剛剛推出了自己的 Project Astra,與OpenAI 的 GPT-4o展開對決。這款通用 AI 代理旨在成為您日常生活中的助手,并利用手機的攝像...
谷歌剛剛推出了自己的 Project Astra,與OpenAI 的 GPT-4o展開對決。這款通用 AI 代理旨在成為您日常生活中的助手,并利用手機的攝像頭和語音識別功能來做出響應(yīng)。
谷歌也利用智能透視 演示了 Astra 項目。
需要明確的是,Astra 將首先應(yīng)用于手機,并將被稱為 Gemini Live,但隨著時間的推移,它有可能轉(zhuǎn)向其他外形。但我可以說,在Google I/O 2024上展示的演示令人印象深刻。
谷歌表示,Project Astra 可以像人類一樣理解和響應(yīng)世界,它可以吸收和記住所見所聞,從而了解背景并采取行動。你也可以自然地與它對話,而不會遇到延遲。
Project Astra 所采用的代理基于Google 的 Gemini模型和其他特定任務(wù)模型構(gòu)建。它可以通過連續(xù)處理視頻和語音輸入來更快地處理信息。
在 Project Astra 演示期間,一個人舉起一部 Android 手機,打開攝像頭的實時視頻,同時問了一系列問題。Project Astra 一點差錯都沒有。
例如,當(dāng)將手機攝像頭對準(zhǔn)桌子并詢問是什么發(fā)出聲音時,阿斯特拉找到了一個電腦揚聲器。然后,那位女士繞著揚聲器的頂部轉(zhuǎn)了一圈,問阿斯特拉這是什么。她正確地回答說是高音喇叭。