91在线亚洲精品专区,久久天天躁夜夜躁狠狠85台湾 ,成人精品一区二区www,的九一视频入口在线观看

名為 DALL-E 的人工智能軟件將您的文字變成圖片

作者:大宰相 時間:2023-07-06 0 A- A+

最近在瀏覽社交媒體動態(tài)時,您很可能會注意到帶有標(biāo)題的插圖。它們現(xiàn)在很流行。

您所看到的圖片很可能是由名為 DALL-E 的文本轉(zhuǎn)圖像程序生成的。在發(fā)布插圖之前,人們會插入文字,然后通過人工智能模型將其轉(zhuǎn)換為圖像。

image

例如,推特用戶發(fā)布了一條推文,其中寫道:“生與死,拉比拿著鱷梨,大理石雕塑。” 附圖非常優(yōu)雅,展示了一個穿著長袍、戴著圓頂禮帽、留著胡須的男子的大理石雕像,手里抓著一個牛油果。

AI模型來自谷歌Imagen 軟件以及由微軟支持的初創(chuàng)公司 OpenAI開發(fā)了 DALL-E 2。在其網(wǎng)站上,OpenAI 將 DALL-E 2 稱為“一種新的人工智能系統(tǒng),可以根據(jù)自然語言的描述創(chuàng)建逼真的圖像和藝術(shù)”。

但該領(lǐng)域發(fā)生的大部分事情都來自相對較小的一群人分享他們的照片,并且在某些情況下產(chǎn)生了很高的參與度。這是因?yàn)楣雀韬?OpenAI 尚未向公眾廣泛提供該技術(shù)。

OpenAI 的許多早期用戶都是員工的朋友和親戚。如果您正在尋求訪問權(quán)限,則必須加入等候名單,并注明您是否是專業(yè)藝術(shù)家、開發(fā)人員、學(xué)術(shù)研究員、記者或在線創(chuàng)作者。

OpenAI 的 Joanne Jang 在該公司的幫助頁面上寫道:“我們正在努力加快訪問速度,但可能需要一些時間才能普及到所有人;截至 6 月 15 日,我們已邀請 10,217 人嘗試 DALL-E 。”網(wǎng)站。

DALL-E Mini是一種公開可用的系統(tǒng)。它利用了組織松散的開發(fā)團(tuán)隊(duì)的開源代碼,并且經(jīng)常超出需求。嘗試使用它時可能會出現(xiàn)一個對話框,顯示“流量過多,請重試”。

這有點(diǎn)讓人想起谷歌的 Gmail 服務(wù),該服務(wù)在 2004 年以無限的電子郵件存儲空間吸引了人們。早期采用者一開始只能通過邀請進(jìn)入,讓數(shù)百萬人等待。現(xiàn)在 Gmail 是世界上最受歡迎的電子郵件服務(wù)之一。

用文本創(chuàng)建圖像可能永遠(yuǎn)不會像電子郵件那樣普遍存在。但這項(xiàng)技術(shù)確實(shí)正在流行,其部分吸引力在于其獨(dú)特性。

私人研究實(shí)驗(yàn)室 Midjourney 要求人們填寫一份表格,如果他們想通過 Discord 聊天應(yīng)用程序的頻道嘗試其圖像生成機(jī)器人。只有少數(shù)人在使用 Imagen 并發(fā)布其中的圖片。

image

文本到圖片服務(wù)非常復(fù)雜,可以識別用戶提示中最重要的部分,然后猜測說明這些術(shù)語的最佳方式。除了外部數(shù)據(jù)之外,谷歌還利用數(shù)百個內(nèi)部 AI 芯片,根據(jù) 4.6 億個內(nèi)部圖像文本對來訓(xùn)練其 Imagen 模型。

界面很簡單。通常有一個文本框、一個啟動生成過程的按鈕以及下面一個用于顯示圖像的區(qū)域。為了表明來源,Google 和 OpenAI 在來自 DALL-E 2 和 Imagen 的圖像的右下角添加了水印。

構(gòu)建該軟件的公司和團(tuán)體有理由擔(dān)心每個人都會同時闖入大門。使用這些人工智能模型處理網(wǎng)絡(luò)請求來執(zhí)行查詢可能會變得昂貴。更重要的是,這些模型并不完美,并且并不總能產(chǎn)生準(zhǔn)確代表世界的結(jié)果。

工程師根據(jù)網(wǎng)絡(luò)上的大量文字和圖片(包括人們在 Flickr 上發(fā)布的照片)對模型進(jìn)行訓(xùn)練。

總部位于舊金山的 OpenAI 認(rèn)識到,通過本質(zhì)上搜索網(wǎng)絡(luò)來學(xué)習(xí)如何制作圖像的模型可能會帶來潛在的危害。為了嘗試解決這一風(fēng)險,員工從訓(xùn)練數(shù)據(jù)中刪除了暴力內(nèi)容,并且如果用戶提交可能違反公司針對裸體、暴力、陰謀或政治內(nèi)容的政策的提示,過濾器會阻止 DALL-E 2 生成圖像。

OpenAI 研究科學(xué)家 Prafulla Dhariwal 表示:“我們正在持續(xù)改進(jìn)這些系統(tǒng)的安全性。”

研究結(jié)果中的偏差也很重要,它代表了對人工智能更廣泛的關(guān)注。來自德克薩斯州的開發(fā)人員鮑里斯·戴瑪 (Boris Dayma) 和其他參與 DALL-E Mini 工作的人在他們的軟件解釋中闡明了這個問題。

他們寫道:“受教育程度較高的職業(yè)(例如工程師、醫(yī)生或科學(xué)家)或高體力勞動的職業(yè)(例如建筑行業(yè))大多由白人男性代表。” “相比之下,護(hù)士、秘書或助理通常是女性,通常也是白人。”

盡管存在風(fēng)險,OpenAI 對這項(xiàng)技術(shù)能夠?qū)崿F(xiàn)的各種事物感到興奮。達(dá)里瓦爾表示,它可以為個人開辟創(chuàng)意機(jī)會,并有助于室內(nèi)設(shè)計(jì)或裝飾網(wǎng)站的商業(yè)應(yīng)用。

隨著時間的推移,結(jié)果應(yīng)該會不斷改善。4 月份推出的 DALL-E 2比 OpenAI 去年宣布的初始版本更逼真,而且該公司的文本生成模型GPT每一代都變得更加復(fù)雜。

版權(quán)聲明: 本文由【B族智能】原創(chuàng),轉(zhuǎn)載請保留鏈接: http://www.r-meiyuan.com/news/show/56.html,部分文章內(nèi)容來源網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系我們刪除處理。謝謝!!!