歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應用。
新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/
1、震撼來襲!Stability AI的SD3.5L新增三大 ControlNet功能 生圖能力再升級
Stability AI 發(fā)布了新版 Stable Diffusion3.5Large,新增三種 ControlNet 功能,分別是Blur、Canny和Depth,顯著提升了圖像生成能力。用戶可在不商業(yè)化的前提下免費使用該模型,尤其是年收入低于100萬美元的小型企業(yè)和創(chuàng)作者也可享受商業(yè)用途的免費使用權(quán)。
【AiBase提要:】
?? 新增三種 ControlNet 功能:Blur、Canny和Depth,提升圖像生成能力。
?? 免費使用協(xié)議:個人和年收入低于100萬美元的企業(yè)可免費使用模型。
?? 強調(diào)安全性:Stability AI 采取措施,防止模型被濫用。
詳情鏈接:https://stability.ai/news/sd3-5-large-controlnets
2、Kimi內(nèi)測AI視頻生成功能:每天免費100秒創(chuàng)作空間
人工智能聊天工具Kimi正在內(nèi)測其創(chuàng)新的AI視頻生成服務——Kimi創(chuàng)作空間,目前處于灰度測試階段,旨在為用戶提供全新的創(chuàng)意表達方式。用戶可以利用12種預設(shè)風格模板和自定義創(chuàng)作功能,制作個性化的音樂視頻,每天還可免費生成100秒的視頻。
【AiBase提要:】
?? Kimi創(chuàng)作空間提供12種預設(shè)風格和自定義功能,讓用戶自由創(chuàng)作個性化視頻。
?? 用戶每天可免費生成100秒的視頻,極大地提升了創(chuàng)作的靈活性。
?? 該功能支持詳細描述視頻場景,為創(chuàng)意表達提供更多可能性,推動AI視頻生成技術(shù)的發(fā)展。
3、跨界無限!智譜AI發(fā)布AutoGLM升級版,一句話操控全網(wǎng)APP
智譜AI近期發(fā)布了AutoGLM的多個升級版本,包括瀏覽器版和電腦版,展現(xiàn)出強大的跨APP操作能力。用戶只需一句話即可在多個應用間自由切換和操作,極大提升了效率。
【AiBase提要:】
? 跨APP操作能力:用戶只需一句話即可在多個應用間進行操作,極大提升了使用效率。
??? GLM-PC語音操控:通過語音指令直接操控電腦,簡化工作流程,成為打工人的救星。
?? AutoGLM全能助手:支持主流APP,用戶可以輕松完成點餐、搜索等任務,展現(xiàn)出AI的智能化和靈活性。
4、特斯拉 “Optimus ” 機器人升級:手部設(shè)計更靈巧、更敏感!
特斯拉公司對其人形機器人“Optimus”進行了重大的手部設(shè)計升級,新增22個自由度和柔軟的保護層,提升了機器人的靈活性和觸覺感應能力。這一創(chuàng)新將為機器人在家庭、醫(yī)療和工業(yè)等領(lǐng)域的應用提供更多可能性,展示了特斯拉在機器人技術(shù)領(lǐng)域的持續(xù)探索。
【AiBase提要:】
?? 新手部設(shè)計具備22個自由度,提升操作靈活性和精準度。
??? 新增的保護層增強觸覺感應能力,安全處理精細物品。
?? 所有驅(qū)動器集成于前臂,計劃年底前完成傳感器整合并減輕重量。
5、亞馬遜開發(fā)新型多模態(tài)語言模型 “Olympus” 或?qū)⒘料?AWS 大會
亞馬遜正在開發(fā)一種名為“Olympus”的多模態(tài)大型語言模型,預計將在下周的AWS re:Invent大會上發(fā)布。該模型不僅能處理文本,還能處理圖像和視頻,具有廣泛的應用潛力。
【AiBase提要:】
?? 新模型“Olympus”將處理文本、圖像和視頻,支持自然語言搜索特定視頻片段。
?? 該模型預計將在下周的AWS re:Invent大會上正式發(fā)布,可能作為AWS Bedrock的一部分。
?? 亞馬遜的AI戰(zhàn)略不僅包括軟件,還涉及硬件開發(fā),推出了針對訓練和推理的專用芯片系列。
6、Rhymes AI推出革命性文本圖像視頻生成模型Allegro-TI2V
Rhymes AI最近推出的Allegro-TI2V模型,標志著文本到視頻生成技術(shù)的重大進步。該模型不僅支持高達79.2K的上下文長度和720×1280的輸出分辨率,還具備高效的視頻生成能力,能夠滿足創(chuàng)作者在電影、游戲和數(shù)字藝術(shù)等領(lǐng)域的需求。
【AiBase提要:】
?? Allegro-TI2V支持高達79.2K的上下文長度和720×1280的分辨率,視頻生成速度可達每秒15幀。
?? 該模型引入了后續(xù)視頻生成和中間視頻生成兩種新模式,極大提升了視頻創(chuàng)作的靈活性與效率。
?? Rhymes AI在Apache2.0許可下發(fā)布Allegro-TI2V,用戶可通過簡單安裝快速上手,應用前景廣泛。
詳情鏈接:https://huggingface.co/rhymes-ai/Allegro-TI2V
7、恐怖如斯!AI只需兩小時訪談,完美復刻一個人個性、85%準確率!
近期,研究團隊與谷歌DeepMind合作,開發(fā)出一種新型AI應用,能夠在僅兩小時的訪談后生成個性模擬,準確率高達85%。這一技術(shù)基于ChatGPT大語言模型,通過提問和記錄參與者的回答,深入了解個性特征。
【AiBase提要:】
?? AI模型在兩小時訪談后生成個性模擬,準確率達到85%。
?? 該技術(shù)旨在降低社會學研究的成本與時間,提高調(diào)查的有效性和廣泛性。
?? 模擬的個性被稱為“代理人”,未來可能改善工作助手及個人機器人的人機互動體驗。
詳情鏈接:https://techxplore.com/journals/arxiv/
8、谷東科技發(fā)布雙目全彩AI+AR眼鏡:無感佩戴+高清鏡頭
谷東科技推出的Star1和Star1S眼鏡代表了AI與AR技術(shù)的完美結(jié)合,提供了全彩顯示和強大的AI功能。這些眼鏡不僅在設(shè)計上考慮了佩戴舒適度,還在技術(shù)上實現(xiàn)了高清畫質(zhì)和多模態(tài)AI系統(tǒng)的應用。Star1S作為業(yè)內(nèi)首款全彩雙目陣列光波導AR眼鏡,預計將于12月上市。
【AiBase提要:】
??? Star1S是首款全彩雙目陣列光波導AR眼鏡,提供更高的佩戴舒適度和畫面清晰度。
?? 搭載多模態(tài)AI系統(tǒng),Star1S在多種環(huán)境下實現(xiàn)全天候長續(xù)航,滿足不同場景需求。
?? 支持與主流應用兼容,用戶可通過眼鏡直接接打電話、觀看視頻,功能接近智能手機。
9.ChatGPT 誕生兩周年,用戶數(shù)突破2億
ChatGPT 自2022年推出以來,經(jīng)歷了快速發(fā)展,成為日常生活中不可或缺的數(shù)字工具。用戶在短時間內(nèi)激增,現(xiàn)已超過2億,每月訪問量達到31億。新版本 GPT-4o 和搜索功能的推出,提升了用戶體驗,但仍存在信息準確性和倫理問題。OpenAI 正在努力解決這些挑戰(zhàn),以進一步優(yōu)化其服務和用戶信任。
【AiBase 提要:】
?? ChatGPT 用戶數(shù)在兩年內(nèi)激增,成為家庭中重要的數(shù)字助手。
?? 新推出的搜索功能改善了信息獲取方式,挑戰(zhàn)傳統(tǒng)搜索引擎。
?? ChatGPT 仍面臨信息準確性和倫理問題,需進一步提升解決方案。
10、超速崛起!xAI僅用1年多就達到了500億美元的估值
埃隆·馬斯克的人工智能公司xAI在短短16個月內(nèi)達到了500億美元的估值,超越了許多競爭對手。與OpenAI相比,xAI的迅速崛起展示了其在AI領(lǐng)域的強大潛力和市場吸引力。公司通過融資和技術(shù)創(chuàng)新,尤其是超級計算機的建設(shè),進一步鞏固了其在行業(yè)中的地位。
【AiBase提要:】
?? xAI在成立16個月內(nèi)達到了500億美元的估值,超越了多家競爭對手。
?? 近期完成了50億美元的融資,用于購買NVIDIA芯片,支持超級計算機建設(shè)。
?? 聊天機器人Grok成為市場強勁競爭者,通過社交媒體訓練提升其響應能力。
(舉報)