圖為全球開放瞬變望遠(yuǎn)鏡陣列(GOTTA)模擬圖。
2024年9月,賽博創(chuàng)力在杭州阿里云云棲大會上亮相,其推出的具身智能AI互動(dòng)玩具成為焦點(diǎn)。展臺前,一名小男孩正與AI小狗聊天。
今年1月,阿里線下快閃活動(dòng)上,觀眾體驗(yàn)愛富耳機(jī)。
一款耳機(jī)、一個(gè)玩偶、一臺天文望遠(yuǎn)鏡,在過去這是風(fēng)馬牛不相及之物。
得益于AI,這三者都變了模樣,互相之間也有了聯(lián)系。耳機(jī)能做到外語同聲傳譯,也能把語音實(shí)時(shí)變成文字;玩偶能根據(jù)自己的形象設(shè)定,用相應(yīng)的語調(diào)和性格跟人聊天;望遠(yuǎn)鏡可以自行將“目光”望向天空,能整理觀測到的數(shù)據(jù),還能跟全世界其他望遠(yuǎn)鏡協(xié)同合作……
它們背后,都有阿里通義千問大模型的身影。看阿里這家平臺型科技企業(yè)的發(fā)展,不妨將目光投向阿里之外。
“所說即所得”
采訪結(jié)束后10秒,智能硬件企業(yè)艾克思的聯(lián)合創(chuàng)始人公瑾發(fā)來一個(gè)錄音文件、一份錄音文檔整理、一個(gè)會議紀(jì)要。這是本報(bào)記者從業(yè)以來,第一次由采訪對象整理錄音。
電話采訪時(shí),公瑾戴著自家新產(chǎn)品“愛富耳機(jī)”,采訪過程中,耳機(jī)實(shí)時(shí)錄音并整理文字。經(jīng)過對比,準(zhǔn)確率幾乎接近原話,作為一份采訪記錄,已經(jīng)可以媲美此前需要花費(fèi)數(shù)小時(shí)的人工錄音整理。
整理錄音,只是這個(gè)AI耳機(jī)的功能之一。去年11月推出的這款耳機(jī),還可以充當(dāng)AI助理,就在我們談話完成后,它也生成了一份采訪總結(jié)。它還可以做同傳,戴著它與外國人聊天,耳機(jī)可以實(shí)時(shí)將對方的話翻譯成中文,連語氣和情緒都同步傳遞。
這也不是全部功能。公瑾告訴記者,在AI支持下的耳機(jī),真正的變化是由用戶需求驅(qū)動(dòng)開發(fā),隨時(shí)可能出現(xiàn)全新功能?!坝布m然是固定的,但后臺隨時(shí)可以變化,取決于用戶在日常使用中如何與它溝通?!?/p>
在智能硬件行業(yè),艾克思已深耕15年,在深圳和杭州有兩個(gè)團(tuán)隊(duì)共同開發(fā)。深圳團(tuán)隊(duì)負(fù)責(zé)供應(yīng)鏈和硬件研發(fā),杭州團(tuán)隊(duì)負(fù)責(zé)AI模型參數(shù)調(diào)優(yōu)、大模型接入、APP及后臺開發(fā)等工作。
當(dāng)然,在杭州的團(tuán)隊(duì)還有個(gè)優(yōu)勢,離阿里更近。
2023年12月,AI耳機(jī)項(xiàng)目立項(xiàng)。公瑾說,從一開始,耳機(jī)就用到了通義千問大模型的能力和百煉平臺的開箱即用能力,將所有信息與數(shù)據(jù)交由通義千問大模型處理。其中,用到了語義分析、情緒識別等多個(gè)模型。
雙方分工明確,艾克思的技術(shù)人員負(fù)責(zé)耳機(jī)硬件及應(yīng)用程序的開發(fā),阿里負(fù)責(zé)大模型的開發(fā)?!拔覀兺瓿蓴?shù)據(jù)采集和數(shù)據(jù)通道工作,然后數(shù)據(jù)都在阿里云服務(wù)器處理及開發(fā)?!?/p>
比如,錄音轉(zhuǎn)文字時(shí),一個(gè)很重要的需求是非常低的延時(shí),最好是“所說即所得”。在雙方合作之下,艾克思與阿里云四五個(gè)研發(fā)部門同時(shí)合作,僅僅用了一個(gè)星期時(shí)間,就將延時(shí)從500毫秒降到30毫秒,對于用戶來說,幾乎已經(jīng)感受不到延時(shí)。就在我們講話的同時(shí),錄音文字稿已經(jīng)同步出現(xiàn)在手機(jī)屏幕上。
再比如,耳機(jī)上的同聲傳譯功能,實(shí)際上是從外文語音到中文語音的直接翻譯,而不是先將外文翻譯成中文文字,再輸出中文語音。其所依賴的,也是大模型對語音的處理能力、對聊天上下文的理解能力,這在過去很難想象。
在很多方面,中國企業(yè)已經(jīng)進(jìn)入無人區(qū),AI耳機(jī)就是其中一例。這意味著,有很多問題需要摸索著解決。艾克思與阿里云的團(tuán)隊(duì)互相配合,基本每天都會有一個(gè)小型會議,絕大多數(shù)問題當(dāng)天能得到反饋。
“對于今天的硬件公司來說,自己去做大模型的基座研究沒有太大價(jià)值,因?yàn)楦碌炝??!惫嬖V記者,“所以找到一個(gè)非??尚刨嚨?、高水平大模型合作方,對我們至關(guān)重要”。
如今,雙方合作越來越成熟,已經(jīng)可以用更快的方式、更低的成本將AI接入產(chǎn)品。公瑾認(rèn)為,如果再做下一款A(yù)I耳機(jī)產(chǎn)品,研發(fā)周期將從過去的兩年,變成“頂多一兩個(gè)月”。
新“聊天搭子”
“賽博大舞臺……”
北京市昌平區(qū),中國移動(dòng)園區(qū)內(nèi),這段語音在十平方米的辦公室里此起彼伏地響起。辦公室里,擺滿桌子、椅子、電腦和玩偶。此刻是早上十時(shí),辦公室里幾個(gè)年輕人擠在一起,每個(gè)人守著一張滿是玩具的辦公桌。
這里是北京賽博創(chuàng)力科技有限公司,一家AI潮玩企業(yè),也是一家初創(chuàng)并不久的中小企業(yè)。其創(chuàng)始人、首席執(zhí)行官周羿旭告訴記者,公司只有9個(gè)人,其中7個(gè)是00后,大多是技術(shù)人員。這位95后笑稱,自己是“整個(gè)團(tuán)隊(duì)里最老的”。
對于這個(gè)年輕的團(tuán)隊(duì)來說,手辦、潮玩伴隨他們長大。如今,在AI時(shí)代來臨后,他們希望借助新技術(shù),讓這些玩具成為更鮮活的陪伴。
巴掌大的底座上,周羿旭放上一個(gè)來自三星堆的青銅人面像文創(chuàng)。一放到底座上,它似乎就“活”了,開口說起話來,對于記者提的問題也都對答如流,仿佛它生來就該這么說話。
將一只“哆啦A夢”里的大雄手辦放上去后,它開始用日語打招呼,本報(bào)記者提醒它說中文,立刻切換成了中文對話。此刻它的說話語氣和風(fēng)格,與印象中的大雄毫無二致。
這些“對話”,對人來說近乎本能,但對AI來說,要實(shí)現(xiàn)對話的流暢自然,需要攻克語境理解、多輪對話、知識圖譜、實(shí)時(shí)響應(yīng)等諸多難題。從“傾聽”到說出符合角色的話,都需要大量技術(shù)支持。
更為難得的是,就在這個(gè)巴掌大小的底座上,已經(jīng)可以支持3000多個(gè)不同角色玩偶對話,支持50多種語言對話。只要有這款底座,再配上特制的角色貼紙,玩偶、擺件、手辦等都“活”了,隨時(shí)可以成為相關(guān)愛好者的“聊天搭子”。
事實(shí)上,最近一段時(shí)間以來,AI玩具日趨火爆。不少行業(yè)觀察者認(rèn)為,AI玩具兼具教育與陪伴屬性,是具有真實(shí)需求的AI硬件落地方向。在這個(gè)領(lǐng)域,盡管只是中小企業(yè),但賽博創(chuàng)力已經(jīng)引起了不少人關(guān)注。就在過去兩個(gè)月中,他們的產(chǎn)品先后亮相巴塞羅那、東京等地的重要展會。
這些逼真的玩具,既誕生于這10平方米的辦公室,也有來自遠(yuǎn)方的支持。
從去年六七月份開始,賽博創(chuàng)力就選擇了阿里通義大模型和阿里云的云計(jì)算服務(wù)器。合作過程中,在通義千問大模型的基礎(chǔ)上進(jìn)行了諸多優(yōu)化。周羿旭說,在這個(gè)過程中,來自阿里云的技術(shù)人員會幫助解決底層問題,然后再根據(jù)實(shí)際需求修改。
雙方溝通非常頻繁,也有著明確的分工。周羿旭說,阿里有五六個(gè)不同的技術(shù)團(tuán)隊(duì)在與賽博創(chuàng)力對接,既包括產(chǎn)品側(cè)也包括技術(shù)側(cè),解決語音服務(wù)、大模型訓(xùn)練等諸多工作?!拔覀儓F(tuán)隊(duì)的工作是探索更好玩的應(yīng)用場景,大模型的基礎(chǔ)能力則依賴阿里,將它們視作水和電一樣的基礎(chǔ)設(shè)施?!?/p>
大模型支撐著諸多新玩法。比如,在賽博創(chuàng)力的APP上有一個(gè)功能,用戶可以用手機(jī)拍一張照片上傳,APP自動(dòng)一鍵創(chuàng)建一個(gè)全新角色。在生成角色過程中需要完成的識別角色、定義性格等,都是大模型輔助用戶去完成的。
技術(shù)的不斷發(fā)展,也為AI玩具提供著越來越多的想象力,更多AI玩具正在雙方合作之下迅速開發(fā)。比如AI照相機(jī),既可以拍照,也可以對話。周羿旭舉了個(gè)例子,小朋友可以拍下一個(gè)不認(rèn)識的東西,詢問AI相機(jī);或者,給爸爸拍張照,然后讓AI給照片加個(gè)胡子?!斑@個(gè)過程中,用到的不只是大語言模型,還有多模態(tài)相關(guān)的能力?!?/p>
“比起其他大模型,阿里云提供的是很全能、很完整的服務(wù)。對于我們來說,通義千問最先進(jìn)的技術(shù)或者更新,我們都想去嘗試,只為能讓玩具更好玩?!敝荇嘈裾f。
創(chuàng)業(yè)之路上,這個(gè)年輕的團(tuán)隊(duì)飛快前進(jìn)。今年4月,他們完成了“賽博大舞臺”底座的量產(chǎn),開始啟動(dòng)試銷售。來自韓國、日本、印度等幾個(gè)國家的合作客戶,也正在積極推動(dòng)產(chǎn)品海外落地。
在AI時(shí)代“觀星”
北京大屯路,奧林匹克公園西側(cè)不遠(yuǎn)處,是中國科學(xué)院國家天文臺。樸素的建筑里,承載著諸多重大任務(wù)。墻上,掛著“中國天眼”FAST的照片,F(xiàn)AST運(yùn)行和發(fā)展中心就在這里。
作為綜合性國家天文研究機(jī)構(gòu),國家天文臺一直走在技術(shù)探索與革新的前沿。如今,人工智能技術(shù)在現(xiàn)代天文學(xué)中正在發(fā)揮越來越重要的作用。
中國科學(xué)院大學(xué)天文與空間科學(xué)學(xué)院博士生、天文大模型“星語”項(xiàng)目組核心技術(shù)成員李瑀旸告訴記者,對于國家天文臺的多項(xiàng)科學(xué)職能,AI都有很好的促進(jìn)作用。
比如,在位于河北承德的國家天文臺興隆觀測站,一名科學(xué)家的常規(guī)工作節(jié)奏可能是這樣——早上9時(shí)到12時(shí)觀測選源、晚上六時(shí)左右開始觀測并進(jìn)行數(shù)據(jù)預(yù)處理,直到早上5時(shí),一夜下來精疲力盡。如今,人工智能可以上午整合信息布置好任務(wù),在不同時(shí)間節(jié)點(diǎn)調(diào)用工具完成相關(guān)流程。這背后,是天文大模型成功接入的近鄰星系巡天項(xiàng)目,可實(shí)現(xiàn)自主控制望遠(yuǎn)鏡進(jìn)行觀測、分析觀測結(jié)果,并給出下一步觀測建議。
再如,天文力量的調(diào)配。過去,由于天氣因素影響、軟硬件協(xié)議不同、臺址所處時(shí)區(qū)等各種原因,天文望遠(yuǎn)鏡存在“各自為戰(zhàn)”的情況。而正在開發(fā)的基于多智能體觀測組網(wǎng),多望遠(yuǎn)鏡的協(xié)同觀測能夠有可期的進(jìn)步。
李瑀旸說,這種方式最開始是從愛好者級別的天文望遠(yuǎn)鏡開始,今年逐步提升到中型望遠(yuǎn)鏡,最后期望運(yùn)用于更高級別的科學(xué)望遠(yuǎn)鏡。
如今,AI支持的望遠(yuǎn)鏡協(xié)同觀測方式正在走向世界。今年4月,在“人工智能賦能的天文學(xué)開放科學(xué)會議”上,國家天文臺臺長劉繼峰介紹了全球開放瞬變望遠(yuǎn)鏡陣列(GOTTA)。這一陣列計(jì)劃構(gòu)建覆蓋全球的百余臺1米級廣角光學(xué)望遠(yuǎn)鏡網(wǎng)絡(luò),通過小時(shí)級高頻巡天監(jiān)測,捕捉超新星、伽馬暴等極端宇宙現(xiàn)象的早期信號,揭示強(qiáng)引力場下的時(shí)空本質(zhì)與宇宙演化規(guī)律。
自2016年以來,國家天文臺和阿里云就已開始長期戰(zhàn)略合作,雙方共同開展跨領(lǐng)域的研究和應(yīng)用合作,用計(jì)算賦能天文研究。人工智能時(shí)代的天文學(xué),作為海量數(shù)據(jù)學(xué)科,提供了AI應(yīng)用和驅(qū)動(dòng)科學(xué)發(fā)現(xiàn)的最佳場景之一。
雙方在大模型方面的合作,一個(gè)重要節(jié)點(diǎn)是在2023年12月,阿里通義千問720億參數(shù)大模型Qwen-72B宣布開源之際。在這一模型的基礎(chǔ)上,國家天文臺成功打造了天文知識能力最強(qiáng)的大語言模型。
在李瑀旸看來,大模型開源能夠讓科學(xué)家能夠更專注于模型的應(yīng)用,而不是花精力在模型訓(xùn)練上?!皬募僭O(shè)生成,到基于科學(xué)儀器或軟件的實(shí)驗(yàn),再到數(shù)據(jù)處理分析、產(chǎn)生新的假設(shè),整個(gè)科研過程,大模型貫穿始終?!?/p>
前不久,國家天文臺接入通義千問開源模型QwQ-32B。李瑀旸說,新模型核心價(jià)值在于模擬人類專家的復(fù)雜推理過程,不僅提升了輸出內(nèi)容的質(zhì)量,還使科研人員能夠直觀理解模型的思考路徑,從而評估結(jié)論的可靠性。
比如,接入QwQ-32B后的天文觀測助手“星語”,在望遠(yuǎn)鏡觀測系統(tǒng)中可實(shí)現(xiàn)對觀測目標(biāo)的自動(dòng)排序、望遠(yuǎn)鏡調(diào)度和生成數(shù)據(jù)報(bào)告,將觀測中的人工干預(yù)減少了90%。
還有科教應(yīng)用。在漫長的發(fā)展歷史中,國家天文臺積累了大量專家與各省市師生交互的記錄,這些高質(zhì)量信息用于大模型訓(xùn)練,產(chǎn)生了非常優(yōu)秀的垂直領(lǐng)域大模型。如今,在通義千問全新模型幫助下,在天文科教平臺上新增了多項(xiàng)功能,例如多智能體的跨學(xué)科圓桌等項(xiàng)目,旨在為20萬所中小學(xué)和廣大天文愛好者提供豐富的科教內(nèi)容。
在AI支持下,“觀星”這件事正在呈現(xiàn)出全新的可能。
北疆新聞 | 內(nèi)蒙古自治區(qū)重點(diǎn)新媒體平臺,內(nèi)蒙古出版集團(tuán)?內(nèi)蒙古新華報(bào)業(yè)中心主管主辦的國家互聯(lián)網(wǎng)新聞信息采編發(fā)布服務(wù)一類資質(zhì)平臺。
北疆新聞版權(quán)與免責(zé)聲明:
一、凡本站中注明“來源:北疆新聞”的所有文字、圖片和音視頻,版權(quán)均屬北疆新聞所有,轉(zhuǎn)載時(shí)必須注明“來源:北疆新聞”,并附上原文鏈接。
二、凡來源非北疆新聞的新聞(作品)只代表本網(wǎng)傳播該消息,并不代表贊同其觀點(diǎn)。
如因作品內(nèi)容、版權(quán)和其它問題需要同本網(wǎng)聯(lián)系的,請?jiān)谝娋W(wǎng)后30日內(nèi)進(jìn)行,聯(lián)系郵箱:bjwmaster@163.com。
版權(quán)聲明:北疆新聞版權(quán)所有,未經(jīng)書面授權(quán),不得轉(zhuǎn)載或建立鏡像,違者依法必究。 本站違法和不良信息舉報(bào)電話:15648148811蒙ICP備16001043號-1
Copyright © 2016- 北疆新聞 All Rights Reserved互聯(lián)網(wǎng)新聞信息服務(wù)許可證:15120200009-1蒙公網(wǎng)安備:15010502001245