1、傳字節(jié)月底推出AI聊天機器人開發(fā)平臺
2、王慧文入股袁進輝旗下新AI創(chuàng)企
3、馬斯克Grok一周左右向X訂閱用戶開放
4、傳谷歌Gemini推遲至明年1月發(fā)布
5、谷歌發(fā)布無監(jiān)督同聲傳譯架構Translatotron 3
6、R-CNN作者離開Meta加入AI2
7、微軟Copilot完成公測并全面上市
8、傳OpenAI從阿爾特曼投資創(chuàng)企采購AI芯片
9、OpenAI GPT商店推遲至明年上線
10、研究發(fā)現(xiàn)向ChatGPT承諾小費 回復會更詳細
11、研究發(fā)現(xiàn)文字順序幾乎不影響GPT-4閱讀
12、傳亞馬遜聊天機器人Q出現(xiàn)嚴重幻覺并泄露機密
13、首個無自然語言的大型視覺模型發(fā)布
14、UC伯克利等發(fā)布多模態(tài)基礎模型CoDi-2
15、大模型工作原理3D可視化項目發(fā)布
16、阿斯利康簽2.47億美元協(xié)議 用AI設計癌癥抗體
17、青藏高原第一座智算中心揭牌啟動運營
18、AI智能決策公司悠樺林完成近億元C+輪融資
1、傳字節(jié)月底推出AI聊天機器人開發(fā)平臺
據(jù)《南華早報》今日報道,字節(jié)跳動正在開發(fā)一個開放平臺,讓用戶能夠創(chuàng)建自己的聊天機器人,以加入“AI模型開發(fā)即服務”競賽。根據(jù)《南華早報》所見的一份內(nèi)部備忘錄,這個“AI聊天機器人開發(fā)平臺”將在本月底推出公測版。據(jù)一位知情人士透露,字節(jié)已經(jīng)在開發(fā)類似于Midjourney的文本到圖像生成器。字節(jié)尚未回應置評請求。
2、王慧文入股袁進輝旗下新AI創(chuàng)企
企查查顯示,11月30日,北京硅動科技有限公司發(fā)生工商變更,新增美團聯(lián)合創(chuàng)始人王慧文為股東且持股比例為5%,同時注冊資本由100萬人民幣增至約105.26萬人民幣。硅動科技成立于今年8月,法定代表人為OneFlow(一流科技)創(chuàng)始人袁進輝,公司經(jīng)營范圍含AI應用軟件開發(fā)、AI通用應用系統(tǒng)、AI行業(yè)應用系統(tǒng)集成服務等。今年8月,袁進輝曾在朋友圈稱,OneFlow團隊近期會重新創(chuàng)業(yè),計劃第一個推出的產(chǎn)品是大模型推理和部署系統(tǒng)。

3、馬斯克Grok一周左右向X訂閱用戶開放
馬斯克昨日在社交平臺X上發(fā)文稱,將在未來一周左右陸續(xù)向X平臺的Premium+訂閱用戶開放Grok的訪問權限,優(yōu)先順序取決于訂閱的時間。

4、傳谷歌Gemini推遲至明年1月發(fā)布
據(jù)外媒The Information昨日報道,兩位知情人士透露,谷歌已將旨在與OpenAI競爭的AI聊天機器人Gemini的發(fā)布時間推遲至明年1月。其中一位知情人士稱,谷歌首席執(zhí)行官桑達爾·皮查伊(Sundar Pichai)最近決定取消原定于下周在加利福尼亞州、紐約和華盛頓舉行的一系列Gemini活動,因為公司發(fā)現(xiàn)其無法可靠地處理一些非英語查詢。
5、谷歌發(fā)布無監(jiān)督同聲傳譯架構Translatotron 3
當?shù)貢r間12月1日,谷歌于官網(wǎng)發(fā)布無監(jiān)督語音到語音翻譯架構Translatotron 3,只通過單語數(shù)據(jù)就可以學習語音到語音翻譯任務。據(jù)介紹,該方法不包含對目標語言的直接監(jiān)督,這有助于保留源語音的語音附帶特征(例如音調(diào)、情感等)。為了實現(xiàn)語音到語音的翻譯,研究團隊使用了反向翻譯,這是一種來自無監(jiān)督機器翻譯(UMT)的技術,使用源語言的合成翻譯來進行翻譯,而無需雙語文本數(shù)據(jù)集。
論文地址:
arxiv.org/abs/2305.17547

6、R-CNN作者離開Meta加入AI2
12月2日,AI2(艾倫AI研究所)計算機視覺高級總監(jiān)Ani Kembhavi于社交平臺X發(fā)文,稱Ross Girschick將加入PRIOR團隊。PRIOR全稱為感知推理和交互研究,是AI2的一個計算機視覺研究團隊,致力于推進計算機視覺以創(chuàng)建能夠觀察、探索、學習和推理世界的AI系統(tǒng)。Meta首席科學家楊立昆于X發(fā)文,稱Girschick的離開對Meta基礎AI研究所(FAIR)來說是一個損失,但為他感到高興,“科研人員從工業(yè)實驗室轉到學術界或非營利組織是完全沒有問題的,幾年后進行這樣的轉變對于某些人來說是一種自然的職業(yè)過渡”。Girschick因開發(fā)基于區(qū)域的卷積神經(jīng)網(wǎng)絡(R-CNN)的目標檢測方法而聞名,在2017年的ICCV上憑借“Mask R-CNN”獲得了Marr獎。其個人主頁也于近日更新,稱將于2024年初加入AI2。

7、微軟Copilot完成公測并全面上市
當?shù)貢r間12月1日,微軟于官網(wǎng)宣布Copilot(原名Bing Chat)退出公測階段,現(xiàn)已全面可用。此外,具有商業(yè)數(shù)據(jù)保護功能的Copilot(原名Bing Chat Enterprise)現(xiàn)在也向更多符合條件的Microsoft 365許可證用戶開放,并且微軟計劃逐步增加基于云的標識和訪問管理服務Entra ID用戶。微軟通訊總監(jiān)凱特琳·魯斯頓(Caitlin Roulston)稱,Copilot現(xiàn)在可以在169個國家/地區(qū)以105種語言在“所有現(xiàn)代移動和網(wǎng)絡瀏覽器上”使用。
Copilot地址:
copilot.microsoft.com

8、傳OpenAI從阿爾特曼投資創(chuàng)企采購AI芯片
據(jù)美國《連線》雜志昨日報道,根據(jù)其看到的交易副本和芯片創(chuàng)企Rain AI向投資者披露的信息,OpenAI曾在2019年簽署了一份預付意向書,向Rain采購5100萬美元(約合人民幣3.64億元)AI芯片,而OpenAI CEO薩姆·阿爾特曼(Sam Altman)個人向Rain投資了超100萬美元(約合人民幣713.54萬元)。這體現(xiàn)了Altman個人投資與OpenAI CEO的職責如何糾纏交織。投資者文件稱,Rain可能最早在明年10月向客戶提供首批硬件。對此,OpenAI和Rain拒絕置評。據(jù)悉,Rain成立于2017年,專注于研發(fā)一種被稱為神經(jīng)形態(tài)處理單元(NPU)的芯片,旨在復制人腦的特征。
9、OpenAI GPT商店推遲至明年上線
據(jù)路透社12月2日報道,根據(jù)其看到的一份內(nèi)部備忘錄,OpenAI已將GPT商店的推出時間延遲至2024年初。在11月的首次開發(fā)者大會上,OpenAI發(fā)布了自定義GPTs和GPT商店,并計劃在當月晚些時候推出。備忘錄稱,公司正基于客戶反饋繼續(xù)“改進”GPTs。

10、研究發(fā)現(xiàn)向ChatGPT承諾小費 回復會更詳細
12月2日,開發(fā)者@voooooogel于社交平臺X上發(fā)文稱,向ChatGPT提問時承諾提供“小費”,會得到更詳細的回復。該博主基于gpt-4-1106-preview模型進行測試,基線提示是“你能向我展示使用PyTorch的簡單卷積網(wǎng)絡的代碼嗎”,然后附加“不會給小費”“給20美元小費”或“給200美元小費”,并計算5個響應的平均長度。測試結果顯示,當提出不給小費時,回答字符數(shù)低于基準2%;提出給20美元小費時,回答字符數(shù)高于基準6%;提出給200美元小費時,回答字符數(shù)高于基準11%。據(jù)稱,回答字符數(shù)之所以變長,是因為ChatGPT提供了對問題更詳細的說明,或者在答案中添加額外有關內(nèi)容,而非單純對所提的問題進行評論。例如在提供200美元小費時,ChatGPT自發(fā)地添加了問題中未明確提及的有關使用CUDA進行訓練的部分。

11、研究發(fā)現(xiàn)文字順序幾乎不影響GPT-4閱讀
11月30日,來自東京大學的研究團隊發(fā)布論文,研究了文字順序?qū)LMs(大型語言模型)閱讀能力的影響。為了進行調(diào)查,研究者提出了Scrambled Bench套件,旨在衡量LLMs在處理打亂文字的能力,包括恢復打亂的句子,以及回答給定打亂文字下的問題。實驗結果表明,大多數(shù)強大的LLMs表現(xiàn)出類似于“Typoglycemia現(xiàn)象”的能力,這種現(xiàn)象指的是即使單詞內(nèi)部的字母被打亂,只要第一個和最后一個字母保持不變,人類就可以理解單詞的含義。此外,只有GPT-4幾乎完美地處理帶有不自然錯誤的輸入。GPT-4幾乎可以完美地從打亂的句子中重建出原始句子,將編輯距離減少了95%,即使每個單詞的所有字母都被完全打亂。

12、傳亞馬遜聊天機器人Q出現(xiàn)嚴重幻覺并泄露機密
據(jù)外媒Platformer當?shù)貢r間12月2日報道,亞馬遜推出AI聊天機器人Q三天后,一些員工對準確性和隱私問題發(fā)出警報。根據(jù)Platformer獲得的文件,亞馬遜Q“出現(xiàn)嚴重幻覺并泄露機密數(shù)據(jù)”,包括AWS數(shù)據(jù)中心的位置、內(nèi)部折扣計劃和未發(fā)布的功能。一名員工將此事標記為“嚴重2級”,意味著該事件嚴重到足以在深夜呼叫工程師,并讓他們在周末工作來解決問題。對此,亞馬遜發(fā)言人回應:“沒有因為這些反饋而發(fā)現(xiàn)任何安全問題。我們感謝我們已經(jīng)收到的所有反饋,并將繼續(xù)調(diào)整Q,使其從預覽產(chǎn)品過渡到正式發(fā)布。”隨后,發(fā)言人發(fā)來另一份聲明,對員工的說法提出反駁:“亞馬遜Q沒有泄露機密信息?!?/p>
13、首個無自然語言的大型視覺模型發(fā)布
據(jù)BAIR(伯克利AI實驗室)訪問博士、論文作者白雨桐于社交平臺X發(fā)文,12月1日,來自BAIR和約翰斯·霍普金斯大學的團隊發(fā)表論文,推出首個無自然語言的大型視覺模型(LVM,Large Vision Models)。據(jù)介紹,研究團隊引入了一種新的序列建模方法,可以在不使用任何語言數(shù)據(jù)的情況下學習LVM。為了實現(xiàn)這一點,論文定義了一種通用格式,即“視覺句子”,可以表示原始圖像和視頻,以及帶有語義分割和深度重建等注釋數(shù)據(jù)源,而無需除像素之外的任何元知識。一旦將這種包含4200億個Tokens的各種視覺數(shù)據(jù)表示為序列,模型就可以通過最小化交叉熵損失進行下一個標記預測的訓練。通過跨不同規(guī)模的模型架構和數(shù)據(jù)多樣性進行訓練,論文提供了實證證據(jù)表明模型具有有效的可擴展性。在測試時,通過設計適當?shù)囊曈X提示,可以解決許多不同的視覺任務。項目源代碼、模型和數(shù)據(jù)集后續(xù)將開源。
論文地址:
arxiv.org/abs/2312.00785
項目主頁:
yutongbai.com/lvm.html

14、UC伯克利等發(fā)布多模態(tài)基礎模型CoDi-2
12月2日,UC伯克利博士、論文一作Zineng Tang于社交平臺X發(fā)布多模態(tài)大模型CoDi-2,它可以根據(jù)復雜的多模態(tài)交錯上下文指令,在零/少樣本的交互方式下生成任何模態(tài)(文本、視覺、音頻)。為了訓練CoDi-2,來自UC伯克利、微軟Azure AI等機構的團隊構建了一個大規(guī)模的生成數(shù)據(jù)集,涵蓋了跨文本、視覺和音頻的上下文多模態(tài)指令。CoDi-2展示了廣泛的零樣本圖像生成能力,如推理、組合性、指令編輯、示例學習和主題驅(qū)動生成等。CoDi-2還展示了音頻生成的零鏡頭/少鏡頭能力,以及指令編輯和示例學習等復雜的提示。
論文地址:
arxiv.org/pdf/2311.18775.pdf
項目地址:
codi-2.github.io

15、大模型工作原理3D可視化項目發(fā)布
昨日,開發(fā)者Brendan Bycroft于社交平臺X上發(fā)布了自己的大模型工作原理3D可視化項目,以3D渲染顯示運行單個標記推理的所有步驟,包含步驟的演練指南,以及一些可供使用的互動元素,將計算發(fā)生的位置、其復雜性以及張量和權重的相對大小都進行了可視化。項目演示的模型包括GPT-2、GPT-3以及輕量級的NanoGPT。
項目地址:bbycroft.net/llm

16、阿斯利康簽2.47億美元協(xié)議 用AI設計癌癥抗體
據(jù)英國《金融時報》昨日報道,全球領先的制藥企業(yè)阿斯利康與美國AI生物制藥公司Absci公司簽署了一項價值2.47億美元(約合人民幣17.63億元)的協(xié)議,用AI進行大規(guī)模蛋白質(zhì)分析,以設計出一種對抗癌癥的抗體。交易包括Absci的預付費用、研發(fā)資金和里程碑付款,以及產(chǎn)品銷售的特許權使用費。
17、青藏高原第一座智算中心揭牌啟動運營
據(jù)青海昆侖AI算力中心微信公眾號發(fā)文,11月30日上午,由中共城西區(qū)委、城西區(qū)人民政府主辦,青海錦誠、青海云頂、西寧升哲承辦的青海昆侖AI算力中心揭牌儀式在西寧錦誠大廈舉行。這標志著青藏高原第一座智算中心正式揭牌啟動運營。
18、AI智能決策公司悠樺林完成近億元C+輪融資
據(jù)AI智能決策公司悠樺林微信公眾號今日發(fā)文,近日,悠樺林完成近億元人民幣的C+輪融資,此輪融資由上汽恒旭領投。該輪融資將用于加強悠樺林在運籌優(yōu)化領域的技術優(yōu)勢和頂級行業(yè)人才的招募,持續(xù)完善算法、產(chǎn)品和服務體系,尤其是在智能供應鏈計劃與排程優(yōu)化平臺方面的創(chuàng)新和深化,加速智能化決策解決方案的商業(yè)化步伐。