1、谷歌發(fā)布零樣本視頻生成模型VideoPoet
2、谷歌將AI代碼輔助功能擴展到所有Colab用戶
3、谷歌將在美國總統(tǒng)大選前限制選舉相關AI檢索
4、微軟Copilot引入音樂生成功能
5、亞馬遜云科技自研芯Graviton3實例落地中國
6、亞馬遜的AI評論摘要被認為夸大負面反饋
7、AI機器人在迷宮游戲中超越人類
8、百度智能云千帆AppBuilder開放服務
9、智源FlagEval 12月榜發(fā)布,新增魯棒性評測
10、摩爾線程首個千卡智算中心落地
11、港中大團隊開源AI音頻工具包Amphion
12、CMU研究稱Gemini Pro不如GPT-3.5 Turbo
13、蓋茨:距美國大眾廣泛使用AI還有18到24個月
14、NewsGuard:全球AI虛假新聞網(wǎng)站已達614個
15、《出版業(yè)生成式人工智能技術應用指南》發(fā)布
16、輕松集團自研大模型升級 發(fā)布七大AI+健康應用
17、AI創(chuàng)企安安創(chuàng)新完成1500萬天使輪融資
18、荷蘭地圖平臺TomTom與微軟合作打造車載AI助手
19、荷蘭數(shù)字金融公司Bunq推出AI聊天機器人
20、藥品連鎖店因濫用AI人臉識別被FTC起訴
1、谷歌發(fā)布零樣本視頻生成模型VideoPoet
今日,谷歌于官網(wǎng)宣布推出用于零樣本視頻生成的大型語言模型VideoPoet。該模型能夠完成多種視頻生成任務,包括文本到視頻、圖像到視頻、視頻風格化、視頻修復、視頻擴張以及視頻到音頻。該模型采用的方法在單個大模型中無縫集成了多種視頻生成功能,而不是依賴于專門針對每項任務的單獨訓練組件。

2、谷歌將AI代碼輔助功能擴展到所有Colab用戶
今日,谷歌于官網(wǎng)宣布將AI代碼輔助功能擴展到所有Colab用戶,包括免費用戶,現(xiàn)已在175個地區(qū)推出。Colab是谷歌提供的一個在線工作平臺,可以免費使用GPU進行深度學習,支持Jupyter Notebook和代碼執(zhí)行程序。
3、谷歌將在美國總統(tǒng)大選前限制選舉相關AI檢索
據(jù)路透社報道,谷歌于當?shù)貢r間周二宣布,在2024年美國總統(tǒng)大選之前,它將限制其聊天機器人Bard和搜索生成體驗所能返回的與選舉有關的查詢類型,這些限制將于2024年初開始實施。
4、微軟Copilot引入音樂生成功能
今日,微軟于官網(wǎng)宣布與AI音樂創(chuàng)作公司Suno合作,以插件形式將其功能引入微軟Copilot,使用戶可以通過簡單的提示輕松創(chuàng)作有趣、巧妙和個性化的歌曲。

5、亞馬遜云科技自研芯Graviton3實例落地中國
12月15日,亞馬遜云科技宣布,通過與光環(huán)新網(wǎng)和西云數(shù)據(jù)的緊密合作,其在亞馬遜云科技北京區(qū)域和寧夏區(qū)域推出基于自研芯片Amazon Graviton3處理器的Amazon Elastic Compute Cloud(Amazon EC2)M7g通用型、C7g計算優(yōu)化型和R7g內(nèi)存優(yōu)化型三款實例。這些實例均基于Amazon Nitro System構(gòu)建,與采用Amazon Graviton2的實例相比,整體性能提升高達25%,內(nèi)存帶寬提升50%,同時能耗更低,能效提升高達60%。其中,M7g實例適用于如應用程序服務器、微服務、游戲服務器等,C7g 實例適用于如高性能計算、視頻編碼、游戲和基于CPU的機器學習推理加速等計算密集型應用程序,R7g實例適用于如開源數(shù)據(jù)庫、內(nèi)存緩存和實時大數(shù)據(jù)分析等內(nèi)存密集型工作負載。
6、亞馬遜的AI評論摘要被認為夸大負面反饋
據(jù)彭博社昨日報道,亞馬遜的AI商品評論摘要功能有時會提供不準確的產(chǎn)品描述,或是夸大負面反饋。一些商家稱,這些摘要是在他們即將進入關鍵的假日購物季時部署的。彭博社審查了數(shù)十篇評論摘要發(fā)現(xiàn),AI在分析顧客評論和生成評論摘要時并不一致,有的突出了批評性反饋,有的則沒有。
7、AI機器人在迷宮游戲中超越人類
據(jù)彭博社報道,蘇黎世聯(lián)邦理工學院的研究人員創(chuàng)造了一個名為CyberRunner的AI機器人,其在迷宮游戲Labyrinth中的表現(xiàn)超過了人類。據(jù)稱,該機器人通過傾斜表面使一個小金屬球穿過迷宮,避開棋盤上的洞,僅用了六個小時就掌握了這個玩具。相關論文于當?shù)貢r間周二發(fā)布,介紹了其建立在基于模型的強化學習領域的最新進展之上的模型,讓AI通過試錯來學習如何在動態(tài)環(huán)境中行動。該項目現(xiàn)已開源發(fā)布,用戶可支付200美元以使用CyberRunner平臺協(xié)調(diào)大規(guī)模實驗。

8、百度智能云千帆AppBuilder開放服務
今日,百度智能云宣布,AI原生應用開發(fā)工作臺——千帆AppBuilder全面開放服務。據(jù)了解,AppBuilder提供兩種產(chǎn)品形態(tài),代碼態(tài)與低代碼態(tài)。對于有深度AI原生應用開發(fā)需求的用戶,AppBuilder代碼態(tài)提供包括SDK、開發(fā)環(huán)境、調(diào)試工具、示例代碼等各種開發(fā)套件和應用組件;而AppBuilder低碼態(tài)則提供可視化工具,用戶只需簡單點選,即可快速定制、上線AI原生應用。
9、智源FlagEval 12月榜發(fā)布,新增魯棒性評測
據(jù)智源研究院微信公眾號發(fā)文,今日,F(xiàn)lagEval大語言模型測評榜單12月榜發(fā)布,本期榜單新增大語言模型魯棒性評測結(jié)果,考察模型對于輸入文本的抗干擾能力;FlagEval平臺更新了C-SEM v2.0數(shù)據(jù)集評測結(jié)果,新增了最新開源的Qwen-72B/1.8B、DeepSeek-67B(Base)模型評測。其中,Qwen-72B-Chat模型主觀評測結(jié)果大幅領先,準確率達83.6%。
據(jù)悉,北京航空航天大學與智源FlagEval團隊共同構(gòu)建了大語言模型魯棒性評測方案,并針對當前主流模型進行了初步評測,本期魯棒性評測數(shù)據(jù)集和評測結(jié)果分為兩個部分:內(nèi)容擾動魯棒性評測(北京航空航天大學構(gòu)建),針對選擇問答、文本分類、代碼生成任務下的MMLU、OCNLI、CSL、HumanEval測試集進行字符(Char)、單詞(Word)、句子(Sentence)三個級別進行內(nèi)容擾動以及對抗性擾動(即采用代理模型和相關算法進行對抗性攻擊),生成了不同的擾動數(shù)據(jù)集;格式擾動魯棒性評測(智源FlagEval團隊構(gòu)建),基于MMLU_Chinese、MMLU、Gaokao2023_v2.0數(shù)據(jù)集,進行選項格式擾動,考察模型是否真正理解了問題和選項并遵從指令的格式要求作答。例如,四個選項的內(nèi)容調(diào)換順序,或者將A、B、C、D改為B、D、C、E。
詳細測評結(jié)果:flageval.baai.ac.cn/#/trending

10、摩爾線程首個千卡智算中心落地
據(jù)摩爾線程微信公眾號發(fā)文,昨日,摩爾線程首個全國產(chǎn)千卡千億模型訓練平臺——摩爾線程KUAE智算中心揭幕儀式在北京成功舉辦,宣告國內(nèi)首個以國產(chǎn)全功能GPU為底座的大規(guī)模算力集群正式落地。同時,摩爾線程CEO張建中發(fā)布了大模型智算加速卡MTT S4000、專為千億參數(shù)大模型訓練和推理提供強大支持的摩爾線程KUAE平臺。據(jù)悉,摩爾線程KUAE支持包括DeepSpeed、Megatron-DeepSpeed、Colossal-AI、FlagScale在內(nèi)的業(yè)界主流分布式框架,并融合了多種并行算法策略,包括數(shù)據(jù)并行、張量并行、流水線并行和ZeRO,且針對高效通信計算并行和Flash Attention做了額外優(yōu)化。
11、港中大團隊開源AI音頻工具包Amphion
12月18日,香港中文大學(深圳)武執(zhí)政副教授帶領的團隊聯(lián)合上海AI實驗室等開源了音頻、音樂和語音生成工具包Amphion v0.1版本。除了文字轉(zhuǎn)語音功能,Amphion還可以將一首歌的聲音換成另一個歌手的聲音,支持聲音轉(zhuǎn)換、歌聲合成、文本到音頻、文本到音樂等功能,歌聲轉(zhuǎn)換目前支持邁克爾·杰克遜、泰勒·斯威夫特、王菲、那英、李健等歌手的聲音。該工具包支持多種模型和架構(gòu),如FastSpeech2、VITS、Vall-E、NaturalSpeech2等,用于不同的音頻生成任務。
論文地址:
arxiv.org/abs/2312.09911
聲音轉(zhuǎn)換Demo地址:
huggingface.co/spaces/amphion/singing_voice_conversion

12、CMU研究稱Gemini Pro不如GPT-3.5 Turbo
據(jù)VentureBeat報道,昨日,卡內(nèi)基梅隆大學(CMU)和BerriAI的研究人員共同發(fā)表了一篇論文,將谷歌的Gemini Pro模型與OpenAI的GPT-3.5 Turbo、GPT-4 Turbo以及Mistral AI的Mixtral 8x7B進行了測試對比,通過一組不同的提示運行所有模型,包括向他們詢問57個不同的多項選擇題,涉及STEM、人文科學、社會科學等方面的內(nèi)容。測試結(jié)果顯示,Gemini Pro得分在十幾個數(shù)據(jù)集的測試上表現(xiàn)都不如GPT-3.5 Turbo。研究人員還發(fā)現(xiàn),當提示不同的模型在標記為A、B、C或D的答案之間進行選擇時,Gemini選擇“D”的次數(shù)比其他模型不成比例地多,無論它是否是正確的答案。
論文地址:arxiv.org/pdf/2312.11444.pdf


13、蓋茨:距美國大眾廣泛使用AI還有18到24個月
比爾蓋茨昨日發(fā)布年度展望博客,其中談道:“如果讓我做個預測,在美國這樣的高收入國家,我猜離普通民眾大量使用AI還有18-24個月的時間。而在非洲國家,我預計在3年左右的時間里,AI的使用就會達到相當?shù)乃?。這仍然是一個差距,但比我們在其他創(chuàng)新中看到的滯后時間要短得多?!彼€提到,希望AI在抗生素藥物、個性化教育、高危妊娠治療、艾滋病風險評估、醫(yī)療信息獲取等方面能夠得到更廣泛的應用。
14、NewsGuard:全球AI虛假新聞網(wǎng)站已達614個
新聞數(shù)據(jù)集網(wǎng)站NewsGuard昨日發(fā)布報告稱,迄今為止,NewsGuard的團隊已識別出614個不可靠的AI生成的新聞和信息網(wǎng)站,涵蓋15種語言。相比今年4月的49個,虛假新聞網(wǎng)站的數(shù)量增加了1153%。這些網(wǎng)站大多使用一些諸如“商業(yè)日報”(iBusiness Day)、“愛爾蘭頭條新聞”(Ireland Top News)、“每日時事更新”(Daily Time Update)等看似權威的名稱,對于消費者來說難以辨認。這些網(wǎng)站發(fā)布的文章涉及政治、技術、娛樂和旅游等主題,包含名人死亡騙局、捏造事件以及將舊事件描述為剛剛發(fā)生等虛假內(nèi)容。
15、《出版業(yè)生成式人工智能技術應用指南》發(fā)布
今日,中國音像與數(shù)字出版協(xié)會發(fā)布關于發(fā)布團體標準《出版業(yè)生成式人工智能技術應用指南》的公告,該指南經(jīng)立項審核、標準起草、征求意見、專家組審查等程序,并通過團標委審查,現(xiàn)予以批準發(fā)布。標準編號為T/CADPA 47-2023,自2024年1月20日起開始實施。
《出版業(yè)生成式人工智能技術應用指南(征求意見稿)》原文地址:
https://web-yinxiang.oss-cn-beijing.aliyuncs.com/yinxiang/upload/yinxiang/file/20231114/1699945418432981.pdf
16、輕松集團自研大模型升級 發(fā)布七大AI+健康應用
據(jù)醫(yī)療健康企業(yè)輕松集團微信公眾號發(fā)文,12月19日,輕松集團旗下醫(yī)療健康服務平臺輕松健康,宣布其自研的垂直領域大模型“輕松問醫(yī)Dr.GPT”全面升級。同時,輕松健康還發(fā)布了基于該大模型研發(fā)七大應用,以滿足不同應用場景及用戶群體的特定需求,包括“智能問診系統(tǒng)”“個性化健康管理顧問”“慢性病管理計劃”“心理健康指導師”“醫(yī)學知識庫和技能培訓平臺”“輔助診療助手”“患教內(nèi)容智創(chuàng)平臺”,覆蓋健康管理服務全場景應用。
17、AI創(chuàng)企安安創(chuàng)新完成1500萬天使輪融資
據(jù)36氪昨日報道,AI創(chuàng)企安安創(chuàng)新近期完成一輪近1500萬元天使輪融資,投資方為個人股東。據(jù)悉,安安創(chuàng)新是一家企業(yè)服務賽道的創(chuàng)業(yè)公司,創(chuàng)立于2021年,公司主要面向民營企業(yè)服務,針對企業(yè)的“治理、管理、金融、財稅、法律”5個維度難題,通過大模型等AI工具進行智能診斷,結(jié)合自主知識圖譜+專家知識庫,輸出專業(yè)解決方案。
18、荷蘭地圖平臺TomTom與微軟合作打造車載AI助手
據(jù)路透社報道,荷蘭數(shù)字地圖平臺TomTom于當?shù)貢r間周二宣布,將與微軟合作打造一款基于AI的車輛對話助手。該助手將允許用戶通過自然語言與車輛交談,并實現(xiàn)與信息娛樂、位置搜索和車輛命令系統(tǒng)的語音交互。TomTom稱,該語音助手可以集成到其他汽車信息娛樂系統(tǒng)中,也可以內(nèi)置到TomTom的數(shù)字駕駛艙中,是一個開放的模塊化車載信息娛樂平臺。
19、荷蘭數(shù)字金融公司Bunq推出AI聊天機器人
據(jù)彭博社今日報道,荷蘭數(shù)字金融公司Bunq推出一款AI聊天機器人Finn,支持用戶查詢自己的支出信息。Finn建立在現(xiàn)有大型語言模型之上,并利用客戶在Bunq平臺上的消費信息進行訓練,由十幾名數(shù)據(jù)專家歷時一年構(gòu)建。

20、藥品連鎖店因濫用AI人臉識別被FTC起訴
據(jù)彭博社報道,美國聯(lián)邦貿(mào)易委員會(FTC)在當?shù)貢r間周二提交給聯(lián)邦法院的一份訴狀中稱,藥品連鎖巨頭Rite Aid在紐約、洛杉磯、巴爾的摩等城市的門店使用了AI面部識別系統(tǒng),但沒有通知顧客。據(jù)該機構(gòu)稱,Rite Aid的面部識別系統(tǒng)產(chǎn)生了數(shù)千個不正確的識別,通常涉及黑人、拉丁裔或女性。由于匹配不當,Rite Aid員工會在商店周圍跟蹤顧客、報警,有時甚至謊稱顧客入店行竊。作為與聯(lián)邦貿(mào)易委員會和解的一部分,該連鎖店同意在未來五年內(nèi)不使用面部識別技術進行監(jiān)控,刪除迄今為止收集的圖像,并向聯(lián)邦貿(mào)易委員會提供有關其合規(guī)情況的年度報告。