?????????聚焦開發(fā)者
OpenAI開發(fā)者大會正式開始接受申請
2023年OpenAI開發(fā)者大會正式開始接受申請,計劃于11月6日在舊金山舉行,涵蓋主題演講、分組會議和晚間招待會。參會者需提交申請,門票費用為450美元,名額有限。主題演講將通過直播方式提供。分組會議將涵蓋API技術(shù)、AI產(chǎn)品開發(fā)最佳實踐等內(nèi)容。
申請地址:https://devday.openai.com/
站長之家提要:
1. OpenAI將舉辦首屆開發(fā)者大會,匯聚開發(fā)者和團隊,預(yù)覽新工具和交流想法。
2. 參會者需提交申請,門票費用為450美元,名額有限,提前申請較有機會。
3. 主題演講將通過直播提供,分組會議將探討API技術(shù)和AI產(chǎn)品開發(fā)實踐等議題。
微軟在開發(fā)AI模型時泄露了38TB敏感數(shù)據(jù)
微軟在GitHub上錯誤使用Azure平臺的共享訪問簽名令牌(SAS),導(dǎo)致38TB的私人數(shù)據(jù)泄露,包括密碼、密鑰和內(nèi)部消息。這次事件凸顯了AI模型訓(xùn)練過程中的安全風(fēng)險和挑戰(zhàn),需要更強的安全措施和協(xié)同工作來確保數(shù)據(jù)的安全性和隱私保護。
圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney
站長之家提要:
1. 微軟在GitHub上分享AI模型訓(xùn)練數(shù)據(jù)時,錯誤使用了權(quán)限過于寬松的SAS令牌,導(dǎo)致數(shù)據(jù)泄露。
2. 數(shù)據(jù)泄露包括38TB的私人文件,其中包括密碼、密鑰和內(nèi)部Microsoft Teams消息,威脅了數(shù)據(jù)的安全性。
3. 事件突顯了SAS令牌的安全風(fēng)險,強調(diào)AI模型訓(xùn)練過程需要更強的安全措施和監(jiān)控以防止類似事件再次發(fā)生。
AI在玩一種很新的藝術(shù)!螺旋控制圖像Illusion Diffusion爆火
AI創(chuàng)作了一種新的藝術(shù)形式,引發(fā)了近700萬網(wǎng)友的圍觀,使用ControlNet技術(shù),創(chuàng)造了一種螺旋圖形的錯覺圖像,受到廣泛關(guān)注。有網(wǎng)友甚至直接在Hugging Face上制作了——Illusion Diffusion,普通用戶只要打開瀏覽器就能玩。
項目地址:https://huggingface.co/spaces/AP123/IllusionDiffusion
站長之家提要:
1、AI創(chuàng)作了一系列圖像藝術(shù)作品,其中以棋盤和螺旋樣式最為流行,吸引了數(shù)百萬網(wǎng)友觀看和點贊。
2、這些AI作品被認為具有錯覺圖形大師埃舍爾的感覺,展示了AI在圖像創(chuàng)作領(lǐng)域的潛力。
3、使用ControlNet技術(shù)和開源AI文生圖模型,網(wǎng)友可以嘗試自己創(chuàng)作這種風(fēng)格的圖像,而且還可以應(yīng)用在視頻和其他領(lǐng)域。
Repilot開源:自動程序修復(fù)的高效補丁生成工具
Repilot是一款基于語義代碼補全和大型語言模型的程序修復(fù)工具,能夠自動分析代碼錯誤并生成修復(fù)補丁,具有錯誤修復(fù)、智能補全、Docker支持等核心功能,旨在提高開發(fā)和維護效率。
項目地址:https://github.com/ise-uiuc/Repilot
站長之家提要:
1. Repilot可自動分析源碼找出錯誤,并生成語義合理的補丁進行修復(fù)。
2. Repilot集成了語義代碼補全引擎,保證補丁語義正確。
3. Repilot支持Docker部署,提供詳盡文檔,易于上手使用。
JoJoGAN:可一鍵生成藝術(shù)化面部圖像的深度學(xué)習(xí)模型
JoJoGAN是一個深度學(xué)習(xí)模型,可將普通面部圖像轉(zhuǎn)化為藝術(shù)化作品,無需專業(yè)干預(yù)。它采用感知損失和身份損失的結(jié)合,確保生成圖像保持個體特征。使用Nvidia T4GPU,平均耗時14秒,成本0.0077美元。但僅適用于面部圖像,對GPU性能要求高。
項目地址:
https://www.aimodels.fyi/models/replicate/903681b6-e6d3-428c-b611-f6afb60b3d18
站長之家提要:
1. JoJoGAN是深度學(xué)習(xí)模型,將普通面部圖像轉(zhuǎn)化為藝術(shù)化作品,無需專業(yè)干預(yù)。
2. 它結(jié)合感知損失和身份損失,保持生成圖像的個體特征。
3. 需要Nvidia T4GPU,僅適用于面部圖像,對GPU性能要求高。
SyncDreamer:從單視圖圖像生成多視圖一致圖像以實現(xiàn)3D重建
SyncDreamer是一個端到端的框架,可以從單個視角的圖像生成多視圖一致的圖像,以實現(xiàn)3D重建。
項目地址:https://github.com/liuyuan-pal/SyncDreamer
站長之家提要:
1. SyncDreamer包含一個diffusion模型和一個differentiable renderer,可以生成質(zhì)量高、多視圖一致的圖像。
2. 先通過diffusion模型生成圖像,再通過renderer生成對應(yīng)的多視圖,計算一致性損失進行優(yōu)化。
3. SyncDreamer生成的圖像可用于高質(zhì)量3D重建,有助于推動3D生成技術(shù)的進步。
韓國AI研究機構(gòu)出品!MagiCapture:個性化生成高分辨率肖像照片
韓國AI研究機構(gòu)推出MagiCapture技術(shù),實現(xiàn)高分辨率肖像照片的多概念個性化生成。該方法采用多概念定制,融合主題和風(fēng)格概念,只需少量參考即可生成高分辨率肖像照片。
論文網(wǎng)址:https://arxiv.org/abs/2309.06895
站長之家提要:
1、MagiCapture采用多概念定制方法,融合主題和風(fēng)格概念,生成高質(zhì)量個性化肖像照。
2、研究人員提供新的注意力重新聚焦損失和即時學(xué)習(xí)策略,明顯優(yōu)于基線方法。
3、MagiCapture代表肖像生成領(lǐng)域的重要技術(shù)進步,為用戶提供更便捷的個性化肖像生成。
??????AI新鮮事
B站UP主手作AI男士婚紗引圍觀 視頻播放量超43萬
一句話概括:B站UP主受AI男士婚紗照啟發(fā),策劃一個月成功制作了一套男士婚紗,視頻展示了設(shè)計過程,播放量超過43萬。
站長之家提要:
1. UP主在女士婚紗基礎(chǔ)上改造,加入了露腰設(shè)計,使用蕾絲和網(wǎng)紗呼應(yīng)上衣,創(chuàng)新以網(wǎng)紗替代裙擺。
2. 男士婚紗在現(xiàn)實不常見,需要大膽創(chuàng)新,難度較高,UP主克服了種種困難成功制作。
3. 視頻在B站上引發(fā)熱議,播放量超過43萬,許多網(wǎng)友紛紛分享喜好。
小紅書博主用AI生成電商模特圖賺到2000
小紅書博主“知影Studio”使用AI技術(shù)為客戶生成電商模特形象照,僅用一個下午的時間就完成了6-7套照片創(chuàng)作,質(zhì)量較高,為電商領(lǐng)域開辟了新的應(yīng)用場景。
站長之家提要:
1、博主用AI工具為客戶快速生成電商形象照片,只用一個下午完成6-7套照片。
2、AI生成的電商模特圖像效率高、質(zhì)量較好,難以找出破綻。
3、小紅書用戶希望看到更豐富、更實用的AI生成電商內(nèi)容,有利于電商領(lǐng)域創(chuàng)新。
Nvidia第二季度交付900噸AI芯片 Meta可能是最大單客戶
Nvidia在第二季度交付了900噸AI芯片,其中大部分可能供應(yīng)給Meta,引發(fā)了市場的廣泛關(guān)注。Omdia的研究表明,對Nvidia AI芯片的需求激增,導(dǎo)致服務(wù)器平均價格上漲30%,并且市場規(guī)模預(yù)測將增長8%。
站長之家提要:
1. Nvidia第二季度向客戶交付了900噸H100AI芯片。
2. 根據(jù)Omdia報告,Nvidia AI芯片需求激增,服務(wù)器平均價格上漲30%。
3. 盡管AI硬件需求增加,但AI實際采用增長相對較慢,未來領(lǐng)域特定AI模型將成為重點。
MSN刪除了抄襲、亂編的AI文章,但問題仍未解決
MSN刊登了一篇似乎由人工智能生成的文章,涉及前NBA球員Brandon Hunter的死訊,后來被撤下。這篇文章被指責(zé)抄襲TMZ Sports博客,并且內(nèi)容混亂不堪,由一家名為Race Track的出版社制作。盡管MSN刪除了這篇文章,但Race Track仍然發(fā)布一連串難以理解的文章,MSN繼續(xù)轉(zhuǎn)載。這問題尚未得到解決。
圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney
站長之家提要:
1. MSN新聞發(fā)布了一篇似乎由人工智能生成的文章,內(nèi)容涉及前NBA球員Brandon Hunter的消息,后來被指責(zé)抄襲并撤下。
2. 這篇文章由名為Race Track的出版社制作,內(nèi)容混亂不堪,很可能抄襲了TMZ Sports博客的內(nèi)容。
3. 雖然MSN刪除了有爭議的文章,但Race Track繼續(xù)發(fā)布難以理解的文章,而MSN則繼續(xù)轉(zhuǎn)載,凸顯了內(nèi)容審查方法的缺失問題。
ChatGPT競爭對手Writer,獲得1億美元融資
Writer獲得1億美元B輪融資,主要面向企業(yè)市場,提供類似于ChatGPT的功能,注重數(shù)據(jù)安全和可解釋性。
站長之家提要:
Writer的融資由ICONIQ Growth領(lǐng)投,已吸引知名企業(yè)投資,收入增長迅速。
Writer的核心技術(shù)是Palmyra大語言模型,已在不同領(lǐng)域取得成功。
Writer提供多種功能,包括文本生成和數(shù)據(jù)安全,適用于各種主流業(yè)務(wù)場景。
騰訊AI新專利可判斷文件對應(yīng)情緒
騰訊近日獲得了一項關(guān)于利用AI處理文本情感的專利。該專利提出了一種方法,可以根據(jù)用戶查看文檔時的情緒反饋,來判斷并展示文檔的情緒傾向,從而讓用戶對文檔內(nèi)容有更明確的預(yù)判。
站長之家提要:
1. 專利可以獲取用戶查看文檔時的情緒數(shù)據(jù),并展示文檔的情緒可視化圖像。
2. 根據(jù)用戶情緒數(shù)據(jù)實時更新并展示情緒可視化圖像。
3. 通過情緒可視化圖像,用戶可以判斷文檔內(nèi)容的情緒傾向,提升體驗。
英國公布AI監(jiān)管原則 開發(fā)者須對輸出內(nèi)容負責(zé)
英國競爭與市場管理局提出新的AI監(jiān)管標(biāo)準(zhǔn),強調(diào)開發(fā)者對AI輸出內(nèi)容負責(zé),關(guān)注問責(zé)和透明度,英國政府致力于推動健康發(fā)展的AI技術(shù)。
站長之家提要:
1、英國競爭與市場管理局引領(lǐng)AI監(jiān)管,要求開發(fā)者負責(zé)AI系統(tǒng)輸出內(nèi)容,關(guān)注問責(zé)和透明度。
2、英國政府計劃成為全球AI產(chǎn)業(yè)和監(jiān)管的領(lǐng)導(dǎo)者,將舉辦全球AI峰會,同時放寬AI文本和數(shù)據(jù)的版權(quán)限制,吸引AI企業(yè)入駐。
3、全球范圍內(nèi),AI監(jiān)管成為熱議話題,各國在制定AI法規(guī)和原則方面積極行動,旨在平衡創(chuàng)新和消費者權(quán)益。
英偉達與 Anyscale 合作
英偉達與Anyscale合作,旨在提高大型語言模型和生成式AI應(yīng)用的開發(fā)效率,解決處理器需求增加和資源受限的問題。
圖片來自NVIDIA
站長之家提要:
1. 大型語言模型在生成式AI工具中需要更多處理器,但處理器價格高昂且供應(yīng)有限,云資源也無法完全解決擴展規(guī)模的問題。
2. 英偉達將其AI技術(shù)引入Anyscale平臺,支持流行的開源模型嵌入到應(yīng)用程序中,并提供自動擴展推理功能,提高性能。
3. Anyscale的Ray框架是全球增長最快的可擴展計算統(tǒng)一框架,與英偉達的合作旨在加速大型語言模型和生成AI應(yīng)用的開發(fā),提供前所未有的速度和效率。
甲骨文發(fā)布語音AI助手,助力醫(yī)療保健領(lǐng)域
甲骨文公司發(fā)布語音生成式AI助手,旨在改善醫(yī)療保健領(lǐng)域的工作流程,將整合到電子健康記錄解決方案中,提供多模態(tài)支持,自動化管理醫(yī)療記錄,幫助醫(yī)護人員提高患者護理質(zhì)量。
圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney
站長之家提要:
1. 甲骨文推出生成式AI助手,解決醫(yī)療保健領(lǐng)域的工作效率和人員短缺問題。
2. 助手通過文本或語音命令工作,提供多模態(tài)支持,改善電子健康記錄的管理和患者護理流程。
3. 助手還提供患者自助服務(wù)體驗,可用于安排約會或支付賬單,預(yù)計在未來12個月內(nèi)全面推出以改善醫(yī)護工作流程。
人工智能可以檢測癡呆癥了!有望改善治療效果
最近賓夕法尼亞州蓋辛格健康系統(tǒng)的研究發(fā)現(xiàn),人工智能工具在檢測未確診癡呆癥方面具有潛在有效性,提供了改善早期診斷和治療的新希望。這項研究表明AI在早期癡呆癥識別中準(zhǔn)確性顯著,可為提高生活質(zhì)量和治療效果提供支持。
圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney
站長之家提要:
1. 賓夕法尼亞州蓋辛格健康系統(tǒng)的研究發(fā)現(xiàn),AI算法在早期癡呆癥的診斷中表現(xiàn)出卓越準(zhǔn)確性。
2. 早期癡呆癥的診斷對干預(yù)和治療至關(guān)重要,傳統(tǒng)方法通常耗時且困難。
3. AI診斷工具有望提高癡呆癥患者的生活質(zhì)量,加速診斷速度和準(zhǔn)確性在臨床實踐中的應(yīng)用。
????????大模型動態(tài)
OpenAI多模態(tài)AI系統(tǒng)GPT-Vision即將推出 與谷歌Gemini競爭
OpenAI即將推出GPT-Vision多模態(tài)AI系統(tǒng),與谷歌Gemini形成直接競爭。GPT-Vision可支持圖像和文本輸入,實現(xiàn)視覺能力增強。OpenAI加速商業(yè)化布局,意在搶占先機。業(yè)內(nèi)認為OpenAI與谷歌競爭將推動行業(yè)技術(shù)進步。
站長之家提要:
1、OpenAI將推出GPT-Vision多模態(tài)AI系統(tǒng),與谷歌Gemini直接競爭
2、GPT-Vision支持圖像和文本輸入,實現(xiàn)視覺能力增強
3、OpenAI與谷歌競爭有利于行業(yè)技術(shù)進步
多模態(tài)大模型MMICL霸榜 支持文本圖像視頻輸入
北京交通大學(xué)等機構(gòu)推出多模態(tài)大模型MMICL,它支持文本、圖像、視頻三種模態(tài)混合輸入,在多項評測中表現(xiàn)搶眼,已開源兩個版本,有望成為多模態(tài)領(lǐng)域新寵。
項目地址:https://github.com/HaozheZhao/MIC
站長之家提要:
1. MMICL支持文本、圖像、視頻三種模態(tài)混合輸入,在多項多模態(tài)能力評測中表現(xiàn)突出。
2. MMICL采用兩階段訓(xùn)練,可實現(xiàn)“現(xiàn)學(xué)現(xiàn)賣”,有效緩解視覺語言模型中的語言偏見。
3. MMICL已開源可商用的Flan版和僅科研用的Vicuna版,都發(fā)布在GitHub上。
??????AI應(yīng)用
字節(jié)跳動旗下云服務(wù)火山引擎數(shù)智平臺VeDI發(fā)布AI助手
字節(jié)跳動旗下云服務(wù)火山引擎在數(shù)據(jù)驅(qū)動科技峰會上推出了數(shù)智平臺VeDI的AI助手,通過接入大語言模型,可以幫助企業(yè)提升數(shù)據(jù)處理和查詢分析效率,即使不懂編程的員工也可以進行業(yè)務(wù)運營數(shù)據(jù)的分析。
站長之家提要:
1. 火山引擎推出VeDI數(shù)智平臺的AI助手
2. AI助手接入大語言模型,提升數(shù)據(jù)處理效率
3. 即使不會編程也可以進行業(yè)務(wù)數(shù)據(jù)分析
谷歌AI聊天機器人 Bard 新增Gmail等谷歌應(yīng)用插件
谷歌AI聊天機器人Bard最近更新,新增對Gmail、Docs、Drive等谷歌應(yīng)用的插件支持,可以實時獲取谷歌服務(wù)信息并與用戶交互。
站長之家提要:
1. Bard支持應(yīng)用插件,可以獲取谷歌服務(wù)實時數(shù)據(jù),如地圖、YouTube等。
2. 用戶可以點擊插件圖標(biāo)或輸入前綴@調(diào)用插件與Bard交互。
3. Bard新增公共鏈接分享功能,用戶可以分享對話給他人在自己設(shè)備上繼續(xù)交互。
Chat Video:用GPT分析和總結(jié)視頻
ChatVideo是基于人工智能的視頻分析和管理工具,利用其獨特的AI技術(shù),能夠通過語音識別快速轉(zhuǎn)錄視頻內(nèi)容成文字,自動生成視頻大綱和總結(jié),并提供強大的問答功能,同時還具備多種可視化功能,提高了視頻的可用性,使用戶能夠高效學(xué)習(xí)和管理視頻。
站長之家提要:
1. ChatVideo利用AI技術(shù)實現(xiàn)高效視頻管理,包括語音識別、自動生成大綱和總結(jié)、強大問答功能等。
2. 用戶能夠通過文字稿件快速定位視頻內(nèi)容,無需重復(fù)播放,提高學(xué)習(xí)效率。
3. 多種可視化功能提升視頻理解,用戶可選擇不同模式獲得最佳體驗。
(舉報)