11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
AI換臉技術(shù)已經(jīng)成為當(dāng)前反詐工作的一大難點(diǎn),對此,榮耀CEO趙明今日發(fā)文宣布,榮耀Magic7的端側(cè)AI模型具備deepfake換臉檢測能力,能在視頻通話中一眼識別真?zhèn)?。從演示視頻中可以看到,榮耀Magic7的AI模型能夠精準(zhǔn)識別視頻中的深度偽造,并為用戶提供對方使用AI換臉的概率提示。榮耀已正式公布兩場發(fā)布會的日期,MagicOS9.0將于10月23日發(fā)布,Magic7系列手機(jī)將于10月30日亮相。
近日,蘋果公司推出了300億參數(shù)的多模態(tài)AI大模型MM1.5,該版本是在前代MM1的架構(gòu)基礎(chǔ)上發(fā)展來的。該模型繼續(xù)遵循數(shù)據(jù)驅(qū)動的訓(xùn)練原則,著重探究在不同訓(xùn)練周期中混合各類數(shù)據(jù)對模型性能產(chǎn)生的影響,相關(guān)模型文檔已在HuggingFace上發(fā)布。盡管MM1.5模型在多項基準(zhǔn)測試中表現(xiàn)優(yōu)異,但蘋果團(tuán)隊仍計劃通過進(jìn)一步融合文本、圖像和用戶交互數(shù)據(jù),并設(shè)計更復(fù)雜的架構(gòu),來提升模型對移動設(shè)備UI的理解能力,從讓蘋果牌”AI更強(qiáng)大。
博主MishaalRahman昨日在社交媒體上透露,谷歌正向美國的安卓用戶推出一系列新功能,其中包括盜竊檢測鎖、離線設(shè)備鎖定和遠(yuǎn)程鎖定等。盜竊檢測鎖定功能利用AI和設(shè)備傳感器來檢測與盜竊相關(guān)的常見動作。這些新功能旨在提高用戶數(shù)據(jù)和隱私的安全性,并為用戶帶來更好的體驗。
Deepfake技術(shù)野蠻生長,引發(fā)了一系列負(fù)面后果。在韓國通訊軟件Telegram上,某私密聊天室成員利用女性照片非法合成色情照片和視頻,影響極為惡劣。合合信息也將積極參與文本圖像篡改檢測標(biāo)準(zhǔn)首批貫標(biāo)測評工作,為行業(yè)豎立標(biāo)桿,助力打造中國“可信AI”在機(jī)器視覺、圖像處理領(lǐng)域的體系建設(shè),以技術(shù)之道反制技術(shù)之險。
ACM國際多媒體會議上組織的多模態(tài)與可靠性情感計算研討會MRAC24公布論文接收結(jié)果,社交平臺SoulApp研究成果《MultimodalEmotionRecognitionwithVision-languagePromptingandModalityDropout》成功入選。作為較早思考將AI應(yīng)用于社交領(lǐng)域的平臺,Soul積極推動AI情感互動能力的研究,目前相關(guān)技術(shù)已應(yīng)用于異世界回響、AI茍蛋、群聊派對等AI陪伴、AI輔助的創(chuàng)新場景。對Soul來說,接下來,將繼續(xù)加大技?
快科技8月7日消息,據(jù)媒體報道,我國應(yīng)急管理領(lǐng)域AI大模型久安”正式發(fā)布。久安”大模型,作為應(yīng)急管理體系中的智慧引擎,深度整合了危險化學(xué)品管理、煤礦安全、森林火災(zāi)防控及安全生產(chǎn)執(zhí)法等多領(lǐng)域的深厚專業(yè)知識,依托國內(nèi)領(lǐng)先的大模型技術(shù)與應(yīng)急云平臺的強(qiáng)大算力,歷經(jīng)精細(xì)化的增強(qiáng)訓(xùn)練,鑄就了其卓越的數(shù)據(jù)處理與分析能力。該模型能夠精準(zhǔn)高效地從海量視頻監(jiān)控資料中,自動識別并篩選出如?;髽I(yè)人員異常聚集、工貿(mào)企業(yè)作業(yè)環(huán)境粉塵超標(biāo)、強(qiáng)降雨誘發(fā)的城市內(nèi)澇等高風(fēng)險隱患,為安全防控提供了前所未有的前瞻性視角。不僅如此,久安”
深圳市羅湖區(qū)南湖街道新南社區(qū)東樂宿舍的居民最近告別了“爬樓時代”,小區(qū)新安裝了兩部共享電梯。這種共享電梯模式不同于傳統(tǒng)電梯安裝,居民無需承擔(dān)高額的安裝費(fèi)用,而是根據(jù)使用情況按次支付0.2元至0.8元不等的費(fèi)用,通過AI識別技術(shù)實現(xiàn)自動扣費(fèi)。目前,電梯處于免費(fèi)使用階段,但將于8月1日啟動階梯式收費(fèi)。居民對這種靈活的收費(fèi)方式表示接受,認(rèn)為它既省錢又?
網(wǎng)店老板姚先生因大量裙子被穿過后退回遭受損失,退貨率的提高還導(dǎo)致店鋪排名下降。類似情況在電商平臺普遍存在,部分消費(fèi)者利用退貨規(guī)則獲取不正當(dāng)利益,損害了商家和市場誠信。呼吁消費(fèi)者理性消費(fèi),做好市場調(diào)查,了解產(chǎn)品信息,以便做出明智選擇。
西湖大學(xué)工學(xué)院張岳教授領(lǐng)導(dǎo)的文本智能實驗室開發(fā)了一種名為Fast-DetectGPT的新文本檢測方法。該方法能高效識別AI生成的文本,并且Fast-DetectGPT無需訓(xùn)練,即可準(zhǔn)確檢測包括ChatGPT、GPT-4在內(nèi)的多種AI語言模型生成的文本。盡管Fast-DetectGPT能提供文本為機(jī)器生成的概率,但鮑光勝博士指出,它無法100%準(zhǔn)確識別,尤其是當(dāng)文本混合了機(jī)器和人工撰寫的部分時。
今日,小米集團(tuán)CMO許斐發(fā)微博稱,自己發(fā)的視頻內(nèi)容被抖音判定疑似AI生成,請謹(jǐn)慎鑒別”,直呼把我整不會了”。好多人問我到底是不是AI生成的,把我整不會了。今年5月份,TikTok宣布,將對所有AI生成內(nèi)容、視頻、圖片進(jìn)行自動標(biāo)記,以防止混淆和誤導(dǎo)觀眾。
在今天凌晨舉行的全球開發(fā)者大會上,蘋果公司宣布了其真無線耳機(jī)AirPods的一系列新功能。其中最引人注目的是,新的固件更新將引入頭部動作識別技術(shù)。這些改進(jìn)顯著提升了AirPods的用戶體驗,使得通話更便捷,更清晰。
在安陽師范學(xué)院舉辦的第六屆全國甲骨文整理與研究暨數(shù)字甲骨共創(chuàng)計劃發(fā)布儀式上,騰訊宣布推出甲骨文AI協(xié)同平臺“殷契文淵2.0”。該平臺提供甲骨文的數(shù)據(jù)采集、存儲、計算能力,并通過AI技術(shù)助力甲骨文破譯?;甍i宇強(qiáng)調(diào),該平臺的最終目標(biāo)是通過信息關(guān)聯(lián)聚合,借助AI實現(xiàn)離散的甲骨學(xué)論著的互聯(lián)分析,使各個團(tuán)隊的專家學(xué)者能夠協(xié)同起來,共同破解甲骨學(xué)研究的難?
谷歌在今天宣布的一系列新的AI模型和工具中將其AI內(nèi)容水印技術(shù)擴(kuò)展到了兩個新的媒介。谷歌旗下的DeepMind首執(zhí)行官DemisHassabis在周二的GoogleI/O開發(fā)者大會上首次登臺,不僅介紹了團(tuán)隊的新AI具介紹了升級版的SynthID數(shù)字水印系統(tǒng)。SynthID只是正在開發(fā)中的幾種AI護(hù)措施之一,旨在對抗技術(shù)的濫用拜登政府正指導(dǎo)聯(lián)邦機(jī)構(gòu)制定相關(guān)準(zhǔn)則。
據(jù)TheInformation消息,OpenAI正籌備展示一種革命性的人機(jī)對話技術(shù)。這一技術(shù)將結(jié)合聲音和文本,不僅能與用戶進(jìn)行流暢的交流具備識別物體和圖像的能力,為用戶帶來前所未有的交互體驗。隨著技術(shù)的不斷進(jìn)步,我們有理由相信,未來的AI將更加智能、更加人性化,為人類生活帶來更多便利和驚喜。
TikTok最宣布,除了在其平臺上使用TikTok的AI工具生成的內(nèi)容外將為其他平臺上創(chuàng)作的內(nèi)容添加“AI生成”標(biāo)簽。TikTok將檢測上傳至其平臺的圖像或視頻,其中包含指示AI生成內(nèi)容存在的元數(shù)據(jù)標(biāo)記,并表示這是首個支持新ContentCredentials的社交媒體平臺?!癆I生成”標(biāo)簽功能包括:-檢測第三方平臺生成的AI內(nèi)容,并添加相應(yīng)標(biāo)簽-支持Adobe的ContentCredentials標(biāo)記系統(tǒng)-實現(xiàn)多階段自動識別和標(biāo)簽功能,提高內(nèi)容真實性和準(zhǔn)確性通過這一舉措,TikTok為用戶提供了更多關(guān)于內(nèi)容生成方式的透明度,同時也促進(jìn)了內(nèi)容的真實性和可信度。
隨著人工智能模型在創(chuàng)建自己的圖像方面變得越來越出色,我們也需要提高對這類圖像的檢測能力。OpenAI已經(jīng)開發(fā)了一個程序,用于檢測圖像是否由人工智能生成。3.在圖像編輯方面,色調(diào)的調(diào)整會顯著降低該系統(tǒng)的識別準(zhǔn)確率至82%。
5月8日,OpenAI在官網(wǎng)宣布,將推出面向其文生圖模型DALL·E3的內(nèi)容識別器,以及一個媒體管理器。隨著ChatGPT、DALL·E3等生成式AI產(chǎn)品被大量應(yīng)用在實際業(yè)務(wù)中,人們越來越難分辨AI和人類創(chuàng)建內(nèi)容的區(qū)別,這個識別器可以幫助開發(fā)人員快速識別內(nèi)容的真假。可以保護(hù)知識產(chǎn)權(quán)增加內(nèi)容的可信度;另一方面,正在為其推出的搜索引擎做鋪墊,可以像谷歌搜索那樣列出所有答案的原始?
在線文本識別模型取得了顯著進(jìn)展,但數(shù)學(xué)表達(dá)識別作為更為復(fù)雜的任務(wù)仍未得到足夠關(guān)注。谷歌研究團(tuán)隊推出了MathWriting,一個專注于在線手寫數(shù)學(xué)表達(dá)的數(shù)據(jù)集,包含230k人工編寫和400k合成樣本,超越了類似IM2LATEX-100K的離線HME數(shù)據(jù)集。未來的研究可以專注于優(yōu)化訓(xùn)練/驗證/測試分割以及開發(fā)針對數(shù)學(xué)表達(dá)的語言模型。
2txt是一個在線OCR工具,能夠?qū)D片中的文字內(nèi)容快速識別并轉(zhuǎn)換成可編輯的文本格式。它支持多種語言的識別,并且操作簡單,用戶只需上傳圖片即可獲得結(jié)果。使用場景示例:學(xué)生將掃描的筆記轉(zhuǎn)換為可編輯文檔進(jìn)行復(fù)習(xí)研究人員將書籍掃描件轉(zhuǎn)換為文本進(jìn)行研究分析企業(yè)將紙質(zhì)文件轉(zhuǎn)換為電子文檔進(jìn)行存檔管理2txt產(chǎn)品特色:圖片文字識別多語言支持快速轉(zhuǎn)換無需注冊隱私保護(hù)想要體驗2txt的功能,請訪問2txt官網(wǎng)。
亞馬遜的AI無人商店項目竟然是靠人工來識別商品,并且每1000筆交易就有700筆需要人工審核。亞馬遜有一個JustWalkOut”的項目,顧客可以在無人商店里選好商品之后,直接走出去無需排隊等待結(jié)賬。亞馬遜發(fā)言人表示:與許多人工智能系統(tǒng)一樣,底層機(jī)器學(xué)習(xí)模型通過生成合成數(shù)據(jù)和注釋實際視頻數(shù)據(jù)來不斷改進(jìn)。
OpenAI發(fā)布了GPT-4-Turbo正式版,這是一個帶有視覺能力的模型,能夠處理128k的上下文。這個模型現(xiàn)在已經(jīng)全面開放,可以通過“gpt-4-turbo”來使用,最新版本為“gpt-4-turbo-2024-04-09”。GPT-4-Turbo是一個功能強(qiáng)大的模型,它的發(fā)布將為AI領(lǐng)域帶來新的可能。
AssemblyAI最新研究成果展示了他們的Universal-1模型在多語言環(huán)境中的表現(xiàn),該模型在準(zhǔn)確性和魯棒性方面均取得了行業(yè)領(lǐng)先地位。Universal-1比WhisperLarge-v3更準(zhǔn)確,比fastWhisper更快,38秒可以處理60分鐘音頻。值得一提的是,非開源,僅提供API調(diào)用。
歡迎來到【今日AI】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
WhisperKit是一個基于Whisper項目的推理工具包,由Argmax公司推出。它允許在iOS和macOS應(yīng)用程序中進(jìn)行語音識別和轉(zhuǎn)錄。欲了解更多信息,請訪問WhisperKit官方網(wǎng)站。
B站UP主“佛辣西威”借助國產(chǎn)電視劇《亮劍》中的“有勝閱兵”視頻片段,成功制作了一支引人注目的AI識別情緒視頻。該視頻在B站上的播放量已經(jīng)達(dá)到186萬,吸引了大量網(wǎng)友參與評論,形成了一場“梗上加?!钡臒岢?。值得一提的是,UP主“佛辣西威”此前已經(jīng)成功制作了多個AI情緒識別的視頻作品,包括今年2月爆火的AI情緒識別《上春山》。
ImagenATexto是一個在線工具,可以將圖像轉(zhuǎn)換為可編輯的文本。它使用先進(jìn)的OCR技術(shù),確保準(zhǔn)確提取圖像中的文本。通過先進(jìn)的OCR技術(shù),ImagenATexto能夠準(zhǔn)確識別圖像中的文字,并提供編輯功能。
Google最近開源了一款名為Magika的文件類型識別系統(tǒng),該系統(tǒng)由AI驅(qū)動,能夠在毫秒級內(nèi)準(zhǔn)確識別超過100種不同的文件類型,包括二進(jìn)制文件和文本文件。在Google內(nèi)部,Magika被廣泛應(yīng)用于提升用戶安全,主要用于對Gmail、Drive和安全瀏覽中的文件進(jìn)行適當(dāng)?shù)陌踩珯z查和內(nèi)容策略掃描。詳細(xì)介紹和演示可以在其網(wǎng)站和GitHub頁面上找到。
Magika是一款由谷歌研發(fā)的快速準(zhǔn)確的文件類型識別工具,基于深度學(xué)習(xí)模型,可以在毫秒級時間內(nèi)識別二進(jìn)制文件和文本文件類型。它的準(zhǔn)確率明顯高于其他現(xiàn)有工具,尤其在識別代碼文件和配置文件時效果更佳。想了解更多Magika的信息,請訪問其官網(wǎng)進(jìn)行深入了解。
Bumble今天宣布推出一款新的人工智能功能,名為DeceptionDetector,旨在幫助識別垃圾郵件、詐騙和欺騙個人數(shù)據(jù)。這一創(chuàng)新工具將在用戶發(fā)現(xiàn)惡意內(nèi)容之前自動采取行動,有效提高用戶在線安全體驗。這一舉措進(jìn)一步強(qiáng)化了Bumble在體驗和在線安全方面的領(lǐng)先地位,為用戶提供更加可靠和真實的社交交流平臺。
WhisperKit是一個專為自動語音識別模型壓縮與優(yōu)化設(shè)計的強(qiáng)大工具。它不僅支持對模型進(jìn)行壓縮和優(yōu)化提供詳細(xì)的性能評估數(shù)據(jù)。通過WhisperKit官網(wǎng),您可以詳細(xì)了解該工具的功能和應(yīng)用,并體驗其卓越的自動語音識別模型優(yōu)化能力。