幺妹直播官方版_幺妹直播直播视频在线观看免费版下载_幺妹直播安卓高清版下载

首頁 > 業(yè)界 > 關(guān)鍵詞  > DALL-E最新資訊  > 正文

OpenAI 發(fā)布 DALL-E 3 文生圖模型:與 ChatGPT 完全集成 在細節(jié)和提示保真度方面挑戰(zhàn)極限

2023-09-21 08:55 · 稿源:站長之家

站長之家(ChinaZ.com) 9月21日消息:本周三,OpenAI 宣布了 DALL-E 3,這是其最新版本的 AI 圖像合成模型,它與 ChatGPT 完全集成。

OpenAI,ChatGPT,人工智能,AI

DALL-E 3 通過緊密遵循復雜的描述并處理圖像內(nèi)文本生成(如標簽和標志)來渲染圖像,這是早期模型所面臨的挑戰(zhàn)。目前處于研究預覽階段,將于十月初提供給 ChatGPT Plus 和企業(yè)客戶。

與其前身一樣,DALL-E 3 是一種文本到圖像生成器,根據(jù)稱為提示的書面描述創(chuàng)建新穎的圖像。盡管 OpenAI 沒有透露關(guān)于 DALL-E 3 的技術(shù)細節(jié),但以前版本的 DALL-E 的核心 AI 模型是基于由人類藝術(shù)家和攝影師創(chuàng)作的數(shù)百萬張圖像進行訓練的,其中一些是從像 Shutterstock 這樣的庫網(wǎng)站獲得許可的。DALL-E 3 很可能也遵循了這一相同的方法,但使用了新的訓練技術(shù)和更多的計算訓練時間。

從 OpenAI 在其宣傳博客上提供的示例來看,DALL-E 3 似乎是迄今為止可用于按提示操作的圖像合成模型中的一個巨大突破。盡管 OpenAI 的示例是精選的,以展示其效果,但它們似乎忠實地遵循了提示的指令,并以無需任何「黑科技」或提示工程即可令對象逼真地呈現(xiàn)出來。

與 DALL-E 2 相比,OpenAI 表示 DALL-E 3 能夠更有效地細化手部等小細節(jié),從而默認情況下創(chuàng)建引人入勝的圖像。

相比之下,來自另一競爭對手供應(yīng)商 Midjourney 渲染了逼真的細節(jié),但仍然需要對提示進行大量反直覺的調(diào)整才能控制圖像輸出。

DALL-E 3 似乎還可以處理圖像中的文本,而其前身無法做到這一點(一些競爭模型,如 Stable Diffusion XL 和 DeepFloyd,在這方面表現(xiàn)得越來越好)。例如,包含「一幅畫中,一個鱷梨坐在治療師椅子上,說著我感到內(nèi)心空虛』,中間有一個坑孔大小的洞」的提示,創(chuàng)建了一個卡通鱷梨,角色的臺詞完美地被包含在一個對話氣泡中。

avocado-square.jpg

圖片來自OpenAI

值得注意的是,OpenAI 表示 DALL-E 3 是「在 ChatGPT 上本地構(gòu)建」的,并將作為 ChatGPT Plus 的一個集成功能推出,使 AI 助手能夠作為頭腦風暴的合作伙伴以一種與當前對話的背景相一致的上下文環(huán)境方式生成圖像。這可能會帶來新的能力。微軟的 Bing Chat AI 助手,也是基于 OpenAI 的技術(shù)構(gòu)建的,自去年三月以來就能夠在對話中生成圖像。

DALL-E 的原始版本于 2021 年 1 月出現(xiàn),OpenAI 在 2022 年 4 月推出了更強大的續(xù)作,以令人震驚的方式引發(fā)了 AI 生成圖像的新時代,深深吸引了最初的封閉測試者。DALL-E 模型使用一種稱為「潛在擴散」的技術(shù),將噪音轉(zhuǎn)化為它從訓練數(shù)據(jù)集中獲得的知識和提示的圖像。同樣的技術(shù)在去年 8 月也使開放權(quán)重模型 Stable Diffusion 誕生。

由于 DALL-E 是通過從人類創(chuàng)作的藝術(shù)作品的大規(guī)模數(shù)據(jù)集中獲取概念來學習圖像的,自從去年引入主流以來,AI 圖像生成技術(shù)一直備受爭議。這項技術(shù)引發(fā)了藝術(shù)家的抗議,他們擔心它會取代他們或不道德地復制他們的風格,引發(fā)了關(guān)于未經(jīng)版權(quán)持有人同意使用作為訓練數(shù)據(jù)的被抓取圖像的版權(quán)侵權(quán)的訴訟,以及關(guān)于美國版權(quán)辦公室和美國地方法院對版權(quán)的新裁決。

作為對這些爭議的回應(yīng),OpenAI 表示,DALL-E 3 將拒絕要求以在世藝術(shù)家風格制作圖像的請求。OpenAI 還提供了一個表單,供創(chuàng)作者選擇不讓他們的圖像用于訓練未來的模型。這些措施似乎不太可能滿足那些通常認為 AI 訓練應(yīng)該僅限于選擇加入而不包含在默認圖像數(shù)據(jù)集中的藝術(shù)家。

目前,美國的版權(quán)政策規(guī)定,純粹由 AI 生成的藝術(shù)作品無法獲得版權(quán)保護,因此使用 DALL-E 3 創(chuàng)建的任何圖像都將屬于公有領(lǐng)域。盡管 OpenAI 沒有明確承認這一點,但它表示「您使用 DALL-E 3 創(chuàng)建的圖像屬于您,您無需我們的許可即可重新印刷、銷售或制作商品。」這與去年 OpenAI 根據(jù)擁有所有生成物權(quán)的許可限制 DALL-E 2 圖像使用的情況有了顯著變化。

關(guān)于安全性,OpenAI 表示,與 DALL-E 2 一樣,DALL-E 3 已經(jīng)實施了關(guān)鍵字和圖像檢測過濾器,以限制其生成暴力、性或令人討厭的內(nèi)容。該系統(tǒng)還被編程拒絕生成涉及具名公眾人物的請求,這一點在競爭的 AI 圖像生成器 Midjourney 生成唐納德·特朗普的虛假逮捕圖像時曾引發(fā)問題。

OpenAI 表示,已經(jīng)與被稱為「紅隊成員」的專家合作,以識別和減輕潛在風險,如有害的偏見或制造宣傳和虛假信息。OpenAI 沒有提及其工具潛在用于以具有說服力的虛構(gòu)來扭曲歷史記錄,盡管它表示正在嘗試使用「來源分類器」工具,該工具可以幫助確定圖像是否由 DALL-E 3 生成。

OpenAI 表示,這款 AI 圖像生成器正在進行封閉測試。計劃通過 API 在十月提供給 ChatGPT Plus 和企業(yè)客戶,并在今年晚些時候在實驗室中提供。

舉報

  • 相關(guān)推薦
  • 突發(fā)!OpenAI發(fā)布Canvas,ChatGPT新增史詩級功能

    今天凌晨2點,OpenAI開啟了第四天技術(shù)直播,發(fā)布了最新功能Canvas。Canvas直接內(nèi)置在ChatGPT中,提供了一個單獨的窗口,主要用于編程、寫作任務(wù),會提供意見、審核和執(zhí)行具體的功能,可以提供更細致的服務(wù)。倘若用戶需要將代碼轉(zhuǎn)換至不同的編程語言,Canvas同樣提供了一鍵移植的實用功能。

  • ChatGPT崩了上熱搜 OpenAI:已經(jīng)確定問題 將盡快恢復服務(wù)

    多位網(wǎng)友在社交媒體反饋稱ChatGPT出現(xiàn)了宕機的情況,隨后“ChatGPT崩了”登上熱搜。根據(jù)站長之家查詢可知,目前ChatGPT出現(xiàn)了重大中斷。openai已經(jīng)確定了問題,并正在展開補救措施,以盡快恢復正常服務(wù),并對停機表示歉意。

  • ChatGPT兩歲,OpenAI 10億用戶計劃曝光!

    【新智元導讀】ChatGPT已經(jīng)2歲了!OpenAI下一個目標瞄準十億用戶,預計明年放出AI智能體產(chǎn)品。就在生日這天,馬斯克還送上了大禮:阻止OpenAI全面盈利的一份訴狀書。隨著人工智能變得更加自主和獨立,它將變得更加神奇。

  • OpenAI整大活!ChatGPT新增電話功能,民AGI要來了

    今天凌晨2點,OpenAI開啟了第10天的直播技術(shù)分享,ChatGPT新增電話功能,并有了專屬電話號碼——1-800。目前這個號碼僅美國地區(qū),無論你是舊款智能手機還是老掉牙的座機都能打通,極大降低了ChatGPT的使用門檻和應(yīng)用范圍,尤其是對于不懂互聯(lián)網(wǎng)的老年人來說非常有幫助。如果用戶在試用后希望進行更長時間的對話,可以直接去源應(yīng)用體驗。

  • ChatGPT重磅功能!支持AI Agent玩法,OpenAI加入智能體了

    今天凌晨2點,OpenAI開啟了第11天的直播技術(shù)分享,對ChatGPT的應(yīng)用程序進行了重磅升級,支持原生應(yīng)用程序自動化協(xié)作功能。從OpenAI在直播中演示的案例來看,基本上與AIAgent功能差不多,尤其是在編程方面非常好。ChatGPT的協(xié)作功能已經(jīng)在Mac應(yīng)用程序中可以使用了,通過OptionSpace就能快速調(diào)用這個功能,并且占用的內(nèi)存非常小,是一個不錯的自動化協(xié)作助手。

  • OpenAI又一王炸!ChatGPT可以打電話了:老年機、座機也能用

    日前,OpenAI官宣12天將進行12場新品發(fā)布會直播,今天是第10天,OpenAI再發(fā)王炸。OpenAI宣布推出ChatGPT電話服務(wù),用戶將ChatGPT添加到電話通訊錄中,然后撥打1-800-242-8478就能和GPT直接語音對話,可以回答用戶提出的問題。ChatGPT從今天開始也支持通過WhatsApp使用,適合喜歡以文字方式交流的用戶,但因平臺限制,用戶無法使用ChatGPT的自定義選項。

  • OpenAI世界最貴大模型上熱搜:每月200美元 ChatGPT Pro擁有無限使用權(quán)

    OpenAI公司在“12天12場直播”活動的首秀中宣布了推理大模型o1的完整版本和進階模式,同時推出了每月200美元的ChatGPTPro訂閱服務(wù)。ChatGPTPlus用戶將逐步獲得完整版o1模型的使用權(quán)限,該模型以o1預覽版形式于9月上線,其特點在于回答用戶問題時會形成類似人類思維方式的內(nèi)部思維鏈條,提高回答專業(yè)問題時的準確性。OpenAI計劃未來為這一訂閱服務(wù)添加更多強大、計算密集型的功能。

  • OpenAI正式推出AI視頻生成模型Sora:ChatGPT訂閱用戶免費用

    在首次公布10個月之后,OpenAI宣布正式向用戶開放人工智能視頻生成模型版本Sora,該系統(tǒng)可以根據(jù)文本提示生成逼真的視頻。OpenAI還推出了Sora的新版本SoraTurbo,稱較2月預覽的版本速度顯著加快,可以生成最長達20秒的視頻,并且可以提供這些視頻的多種變體。OpenAI表示,正在針對不同類型的用戶制定量身定制的價格方案,計劃于明年年初推出。

  • ChatGPT拒絕談?wù)撨@個人,沒人知道為什么

    ChatGPT兩歲了,版本更新沒等來,卻被發(fā)現(xiàn)一個神秘Bug。一個看似平平無奇的名字“DavidMayer”成為頭號禁忌,ChatGPT拒絕談?wù)撚嘘P(guān)他的一切。之前有消息稱OpenAI計劃在明年1月初推出代號為“Operator”的智能體,幫助人們自動完成寫代碼或訂餐等操作。

  • AI日報:百川智能金融大模型發(fā)布;ChatGPT新增跨對話記憶功能;DeepSeek大模型一開發(fā)者將加盟小米;OpenAI最強推理模型o3

    歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、OpenAI發(fā)布o3:AI推理能力的重大突破,得分高達87.5%OpenAI最近推出了其最新的o-Model推理系列模型o3,標志著在數(shù)學和科學推理領(lǐng)域的重大進展。閃極還推出了一個吸引人的促銷活動,用戶在300天內(nèi)打卡200天可獲得全額退款。

熱文