1、阿里發(fā)布肖像視頻生成框架EMO
2、Pika推出“對口型”功能
3、傳蘋果放棄電動汽車制造轉(zhuǎn)向生成式AI
4、特斯拉APP推出AI聊天助手測試版
5、Gemini 1.5通過視頻成功修復(fù)Bug
6、谷歌將進(jìn)行結(jié)構(gòu)性調(diào)整以解決Gemini偏見問題
7、研究顯示Gemini等在選舉上存在偏見
8、傳谷歌向媒體付費(fèi)測試AI寫作工具
9、扎克伯格拜訪日韓討論AI、XR合作
10、OpenAI稱《紐約時(shí)報(bào)》侵權(quán)指控存在欺騙行為
11、歐盟監(jiān)管機(jī)構(gòu)擬審查微軟對Mistral的投資
12、GitHub推出企業(yè)版Copilot
13、微軟正測試Copilot GPT
14、百度2023年凈利潤漲39%
15、百度Comate啟動眾測活動
16、螞蟻集團(tuán)推出多模態(tài)遙感模型SkySense
17、魅族Aicy語音助手接入AI大模型
18、OPPO Reno11系列將引入生成式AI功能
19、南京大學(xué)開設(shè)AI通識核心課程體系
20、傳Tumblr等計(jì)劃將數(shù)據(jù)出售給AI公司
21、Prophesee與高通合作進(jìn)入可量產(chǎn)階段
22、芯片大神Jim Keller創(chuàng)企與日企合作設(shè)計(jì)AI芯片
23、法AI圖像創(chuàng)企獲4300萬美元融資
24、字節(jié)推出MegaScale 將LLM訓(xùn)練擴(kuò)展到1萬個(gè)GPU
1、阿里發(fā)布肖像視頻生成框架EMO
今日,來自阿里巴巴的團(tuán)隊(duì)發(fā)布了音頻驅(qū)動的肖像視頻生成框架EMO(Emote Portrait Alive),相關(guān)論文同步發(fā)表于arXiv。輸入一張參考圖像和聲音音頻,該框架能夠生成具有豐富面部表情和頭部姿勢的聲音肖像視頻。
論文地址:
arxiv.org/pdf/2402.17485.pdf
項(xiàng)目主頁:
humanaigc.github.io/emote-portrait-alive/

2、Pika推出“對口型”功能
昨晚,AI視頻生成平臺Pika宣布推出為生成視頻中的人物配音,并同時(shí)“對口型”的唇形同步功能LipSync,目前僅支持Pro用戶體驗(yàn)。其中,音頻生成部分由AI語音克隆創(chuàng)企ElevenLabs提供技術(shù)支持。

3、傳蘋果放棄電動汽車制造轉(zhuǎn)向生成式AI
據(jù)彭博社援引知情人士消息報(bào)道,蘋果在當(dāng)?shù)貢r(shí)間周二于公司內(nèi)部宣布取消長達(dá)十年的電動汽車項(xiàng)目,從事該項(xiàng)目的近2000名員工中的許多人將被轉(zhuǎn)到由約翰·詹南德雷亞(John Giannandrea)領(lǐng)導(dǎo)的AI部門,專注于生成式人工智能項(xiàng)目。
4、特斯拉APP推出AI聊天助手測試版
據(jù)electrek報(bào)道,特斯拉今日更新了移動端應(yīng)用程序,推出測試版聊天助手,可以回答有關(guān)特斯拉或其他產(chǎn)品的問題。

5、Gemini 1.5通過視頻成功修復(fù)Bug
昨日,社交平臺X博主Mckay Wrigley稱Gemini Pro 1.5通過視頻和文本成功修復(fù)了問題代碼。他將整個(gè)代碼庫以文本形式發(fā)送給Gemini Pro 1.5,并同時(shí)上傳了攝像頭拍攝的三個(gè)出錯(cuò)的程序界面,輸入“請幫我修復(fù)代碼中的所有Bug”等提示詞,Gemini直接給出了問題代碼位置和解決方案。

6、谷歌將進(jìn)行結(jié)構(gòu)性調(diào)整以解決Gemini偏見問題
據(jù)Semafor今日報(bào)道,谷歌CEO桑達(dá)爾·皮查伊(Sundar Pichai)在當(dāng)?shù)貢r(shí)間周二晚間回應(yīng)了Gemini的種族偏見爭議,稱該問題“不可接受”,并發(fā)誓要進(jìn)行結(jié)構(gòu)性調(diào)整來解決問題。他在內(nèi)部信中說,公司在修復(fù)Gemini護(hù)欄方面已經(jīng)取得了進(jìn)展,“我們的團(tuán)隊(duì)一直在夜以繼日地工作來解決這些問題。我們已經(jīng)看到各種提示都得到了顯著的改進(jìn)?!?/p>
7、研究顯示Gemini等在選舉上存在偏見
據(jù)非盈利新聞工作室Proof今日發(fā)布的報(bào)告,GPT-4、Llama 2、Gemini、Mixtral和Claude等領(lǐng)先的五個(gè)AI文本模型在26個(gè)選舉相關(guān)問題上準(zhǔn)確性表現(xiàn)不佳,超過一半的相應(yīng)被AI專家評委不準(zhǔn)確,40%的回答被評為有害。其中,Gemini、Llama2和Mixtral的不準(zhǔn)確答案率最高,均超過60%。

8、傳谷歌向媒體付費(fèi)測試AI寫作工具
據(jù)ADWEEK昨日報(bào)道,谷歌上個(gè)月為少數(shù)獨(dú)立出版商推出一項(xiàng)計(jì)劃,為后者提供未發(fā)布的生成式AI平臺測試版訪問權(quán)限,來換取分析和反饋。作為協(xié)議的一部分,出版商將使用該工具套件在12個(gè)月內(nèi)每天發(fā)布3篇內(nèi)容,每月可以獲得五位數(shù)的津貼。
9、扎克伯格拜訪日韓討論AI、XR合作
據(jù)路透社報(bào)道,Meta CEO扎克伯格周二拜訪了東京,與日本首相岸田文雄討論了AI問題。周二晚間,他抵達(dá)韓國,并于今日會見了LG電子CEO、LG母公司COO,討論下一代XR設(shè)備開發(fā)相關(guān)業(yè)務(wù),以及在AI領(lǐng)域的潛在合作。
10、OpenAI稱《紐約時(shí)報(bào)》侵權(quán)指控存在欺騙行為
據(jù)The Verge報(bào)道,OpenAI在當(dāng)?shù)貢r(shí)間周一提交的一份動議中稱,《紐約時(shí)報(bào)》使用“欺騙性提示”讓ChatGPT重復(fù)其內(nèi)容,并請求紐約南部的美國地方法院駁回《紐約時(shí)報(bào)》版權(quán)侵權(quán)訴訟中的幾項(xiàng)索賠。
11、歐盟監(jiān)管機(jī)構(gòu)擬審查微軟對Mistral的投資
據(jù)The Information報(bào)道,歐洲最高反壟斷監(jiān)管機(jī)構(gòu)歐盟委員會當(dāng)?shù)貢r(shí)間周二稱,計(jì)劃審查微軟對法國生成式AI初創(chuàng)公司Mistral的投資。微軟于周一宣布與Mistral建立合作伙伴關(guān)系,向Mistral投資1630萬美元,并在云平臺Azure中提供Mistral的模型。
12、GitHub推出企業(yè)版Copilot
微軟旗下的GitHub今日推出Copilot Enterprise,可根據(jù)企業(yè)內(nèi)部的代碼和知識庫定制,每人每月39美元。

13、微軟正測試Copilot GPT
昨日,微軟副總裁兼Copilot和必應(yīng)工程與產(chǎn)品負(fù)責(zé)人約爾迪·里巴斯(Jordi Ribas)透露,微軟正在測試Copilot GPT,當(dāng)用戶打開Microsoft Copilot時(shí)會出現(xiàn)一個(gè)新的Copilot GPT列表,可為用戶提供健身訓(xùn)練計(jì)劃、計(jì)劃假期和幫助烹飪等功能。

14、百度2023年凈利潤漲39%
據(jù)百度微信公眾號今日發(fā)文,其2023年?duì)I收為1345.98億元,凈利潤287億元,同比增長39%;其第四季度營收349.51億元,凈利潤77.55億元,同比增長44%。其中,AI成為增長新動力,百度智能云、PP飛槳等AI平臺高速增長,千帆大模型平臺累計(jì)精調(diào)模型1萬個(gè),AI出行平臺蘿卜快跑第四季度提供乘車服務(wù)83.9萬次。
15、百度Comate啟動眾測活動
據(jù)百度安全應(yīng)急響應(yīng)中心微信公眾號今日發(fā)文,百度智能編程工具Comate及千帆大模型平臺開啟專項(xiàng)加碼眾測活動,活動時(shí)間為2月29日-3月12日,單個(gè)漏洞獎(jiǎng)勵(lì)最高可達(dá)3萬元。
16、螞蟻集團(tuán)推出多模態(tài)遙感模型SkySense
螞蟻集團(tuán)今日宣布推出20億參數(shù)多模態(tài)遙感基礎(chǔ)模型SkySense,這是螞蟻百靈大模型在多模態(tài)領(lǐng)域最新的研發(fā)成果,其論文已被世界計(jì)算機(jī)視覺頂會CVPR 2024接收。數(shù)據(jù)顯示,SkySense在17項(xiàng)測試場景中指標(biāo)均超過國際同類產(chǎn)品,可用于地貌、農(nóng)作物觀測和解譯等,有效輔助農(nóng)業(yè)生產(chǎn)和經(jīng)營。

17、魅族Aicy語音助手接入AI大模型
據(jù)IT之家報(bào)道,魅族21系列手機(jī)今日獲推Flyme 10.5.0.1A穩(wěn)定版系統(tǒng),語音助手小溪(Aicy)接入大模型,支持自然語言對話、文檔總結(jié)、知識問答、出行規(guī)劃、運(yùn)動健康建議、文案生成等AI功能。

18、OPPO Reno11系列將引入生成式AI功能
昨日,OPPO在2024年世界移動通信大會(MWC 2024)宣布將全面發(fā)力AI領(lǐng)域。OPPO還宣布,今年第二季度,全球OPPO Reno11系列及OPPO Find N3也將引入包括AI消除功能在內(nèi)的一系列生成式AI功能。
19、南京大學(xué)開設(shè)AI通識核心課程體系
昨日,南京大學(xué)宣布將面向全體本科新生開設(shè)“人工智能通識核心課程體系”。南京大學(xué)將建設(shè)“1+X+Y”三層次“人工智能通識核心課程體系”,以1門必修的AI通識核心課+X門AI素養(yǎng)課+Y門個(gè)學(xué)科與AI深度融合的前沿拓展課為基礎(chǔ),從知識、能力、價(jià)值觀與倫理三個(gè)維度開展教育教學(xué)。
20、傳Tumblr等計(jì)劃將數(shù)據(jù)出售給AI公司
據(jù)404 Media今日援引內(nèi)部文件報(bào)道,社交平臺Tumblr和博客網(wǎng)站W(wǎng)ordPress.com的所有者正在與AI公司Midjourney和OpenAI進(jìn)行談判,以提供從用戶帖子中抓取的訓(xùn)練數(shù)據(jù)。
21、Prophesee與高通合作進(jìn)入可量產(chǎn)階段
神經(jīng)擬態(tài)視覺傳感公司Prophesee 2月27日宣布與高通的合作進(jìn)入可量產(chǎn)階段。在巴塞羅那世界移動通信大會MWC 2024期間,Prophesee展示了其解決方案與驍龍旗艦移動平臺的原生兼容性,以及神經(jīng)擬態(tài)視覺技術(shù)為智能手機(jī)攝像頭帶來的速度、能效和成像質(zhì)量方面的提升。Prophesee Metavision事件視覺傳感器和AI算法針對驍龍平臺進(jìn)行了優(yōu)化,使運(yùn)動模糊消除的效果和整體圖像的質(zhì)量都得到前所未有的提升,尤其是在快速移動和低光等傳統(tǒng)基于幀的RGB傳感器難以應(yīng)對的場景中。
22、芯片大神Jim Keller創(chuàng)企與日企合作設(shè)計(jì)AI芯片
根據(jù)彭博社昨日報(bào)道,日本政府投資的半導(dǎo)體研發(fā)集團(tuán)Rapidus將與加拿大芯片創(chuàng)企Tenstorrent合作設(shè)計(jì)其首款A(yù)I芯片。Tenstorrent將授權(quán)其設(shè)計(jì)日本AI加速器的一部分,并與Rapidus共同設(shè)計(jì)整個(gè)芯片。Tenstorrent成立于2016年,首席執(zhí)行官為芯片界大神吉姆·凱勒(Jim Keller)。Rapidus成立于2022年,計(jì)劃在2027年開始芯片生產(chǎn),與臺積電和三星電子等公司競爭。
23、法AI圖像創(chuàng)企獲4300萬美元融資
據(jù)TechCrunch昨日報(bào)道,法國AI圖像編輯器創(chuàng)企Photoroom近期以5億美元估值完成了4300萬美元融資,Balderton Capital領(lǐng)投此輪融資,新投資者Aglaé和之前的投資者Y Combinator參投。Photoroom目前擁有約50名員工,計(jì)劃利用這筆融資雇用更多員工,并投資于研發(fā)和基礎(chǔ)設(shè)施。
24、字節(jié)推出MegaScale 將LLM訓(xùn)練擴(kuò)展到1萬個(gè)GPU
2月24日,來自字節(jié)和北大的團(tuán)隊(duì)在arXiv上發(fā)表論文,提出大模型生產(chǎn)系統(tǒng)MegaScale。MegaScale將大型語言模型訓(xùn)練擴(kuò)展到超過10000個(gè)GPU,在12288個(gè)GPU上訓(xùn)練175B LLM模型時(shí),MegaScale實(shí)現(xiàn)了55.2%的模型FLOP利用率(MFU),與層內(nèi)模型并行技術(shù)Megatron-LM相比,MFU提高了1.34倍。
論文地址:
https://arxiv.org/abs/2402.15627