劃重點(diǎn):
?? 研究團(tuán)隊(duì)在牛津大學(xué)開發(fā)了名為 Magi 的先進(jìn)工具,可以幫助視障讀者更容易地閱讀漫畫。
?? Magi 的方法包括智能地識(shí)別漫畫頁面上的面板、人物和文字塊。
?? 這項(xiàng)研究不僅突破了漫畫可訪問性的障礙,還展示了人工智能在提高可訪問性方面的潛力。
站長之家(ChinaZ.com)3月18日 消息:在講故事方面,日本漫畫,即漫畫,在全球范圍內(nèi)贏得了巨大的市場,以其復(fù)雜的情節(jié)和獨(dú)特的藝術(shù)風(fēng)格吸引著觀眾的注意。盡管它們具有全球吸引力,但一個(gè)重要的潛在讀者群體卻被忽視了:視障人士。對(duì)于他們來說,漫畫的視覺中心性創(chuàng)造了一個(gè)無法訪問的領(lǐng)域,盡管漫畫中有豐富的敘事。
當(dāng)前漫畫之所以難以訪問,主要挑戰(zhàn)在于將視覺豐富的內(nèi)容轉(zhuǎn)化為視障人士可訪問的格式。早期的漫畫在很大程度上依賴于交織的視覺元素和文字,使體驗(yàn)固有地具有視覺性。這種視覺依賴意味著視障人士通常無法參與漫畫藝術(shù)家創(chuàng)造的故事、人物和世界。
目前使漫畫可訪問的解決方案遠(yuǎn)非理想,主要是因?yàn)樗鼈円蕾囉谑謩?dòng)轉(zhuǎn)錄或音頻描述,這種方法勞動(dòng)密集且難以有效擴(kuò)展。這種差距突出了需要更有效的自動(dòng)化方法來使所有觀眾都能夠欣賞漫畫,無論其視覺能力如何。
牛津大學(xué)的研究團(tuán)隊(duì)開發(fā)了一種先進(jìn)工具,名為 Magi,這標(biāo)志著使漫畫對(duì)視障讀者更具可訪問性的突破。Magi 是一個(gè)打開以往因視覺障礙而鎖定的故事的通道,為所有讀者提供了新的參與水平。
Magi 的方法包括智能地識(shí)別漫畫頁面上的面板、人物和文字塊,以及將對(duì)話與其相應(yīng)的講話者相關(guān)聯(lián),保持?jǐn)⑹碌耐暾?。通過嚴(yán)格測試,Magi 展示了在檢測和聚類人物以及將文本與正確的講話者相關(guān)聯(lián)方面的優(yōu)越能力,超越了現(xiàn)有方法。這種效率展示了該工具的精確性,以及它改變漫畫閱讀為一種所有視障人士都可以享受的包容性活動(dòng)的潛力。
這項(xiàng)研究和開發(fā)工作突顯了輔助技術(shù)方面的重大進(jìn)展。通過利用復(fù)雜的算法和機(jī)器學(xué)習(xí),Magi 為無法看到的人打開了一個(gè)以前無法訪問的漫畫世界。這一創(chuàng)新的影響超越了漫畫,它為技術(shù)如何彌合娛樂領(lǐng)域的鴻溝樹立了一個(gè)先例,使其普遍可訪問。
開發(fā) Magi 有助于使文化和娛樂內(nèi)容的獲取更加民主化。它突顯了向包容性轉(zhuǎn)變的趨勢,打破了享受樂趣的障礙,使故事變得普遍可訪問。這項(xiàng)研究不僅突顯了人工智能在提高可訪問性方面的潛力,還號(hào)召進(jìn)一步在這一領(lǐng)域進(jìn)行創(chuàng)新。隨著技術(shù)的發(fā)展,希望更多的大門會(huì)打開,讓每個(gè)人無論身體上的限制如何,都能探索廣闊多樣的娛樂和文化景觀。Magi 從概念到實(shí)施的歷程揭示了通往一個(gè)更加包容的世界的道路,讓故事的樂趣無限延伸。
產(chǎn)品入口:https://top.aibase.com/tool/magi
論文:https://arxiv.org/abs/2401.10224v1
(舉報(bào))