新鮮AI產品點擊了解:https://top.aibase.com/
??????AI新鮮事
自定義ChatGPT商店下周上線
OpenAI宣布將上線自定義GPT商店,用戶可以將自己開發(fā)的自定義ChatGPT助手進行分享的平臺。這一商店的功能類似于蘋果的App Store,在大模型領域提供了新的商業(yè)機會。
【AiBase提要:】
?? OpenAI將上線自定義GPT商店,用戶可以將自己開發(fā)的自定義ChatGPT助手進行分享。
?? 用戶可以通過可視化點擊操作,快速開發(fā)特定領域的ChatGPT助手,并選擇是否對外開放以獲取付費收入。
?? 商店中的自定義GPT助手可以是私有模型,只與自己的同事或公司內部分享,也可以對全球用戶開放。
小冰克隆人正式上線,有網紅靠它年入破百萬
小冰公司宣布將一系列測試產品轉為正式發(fā)布,測試期間部分大V網紅年收入已破百萬。小冰克隆人通過小冰框架技術克隆創(chuàng)作者,具備創(chuàng)作者本人的性格、記憶、知識、聲音與容貌。
【AiBase 提要】
??小冰克隆人正式上線,允許創(chuàng)作者克隆自己,并向粉絲發(fā)布;
??克隆人具備創(chuàng)作者本人的性格、記憶、知識、聲音和容貌
??小冰公司的數字員工產品已構建豐富的完整產品體系,數字互動名片和數字員工直播解決方案都已上線。
AI搜索引擎Perplexity再吸金5.28億
Perplexity宣布完成B輪融資,籌得7360萬美元,由IVP、NEA、NVIDIA、Jeff Bezos等多家知名投資機構參與,估值達5.2億美元。
【AiBase提要:】
?? B輪融資完成: Perplexity完成B輪融資,籌得7360萬美元,估值達5.2億美元,由IVP、NEA、NVIDIA、Jeff Bezos等多家投資機構參與。
?? AI原生搜索服務: Perplexity提供人工智能搜索服務,具有即時、可靠的答案,并附帶完整的來源和引用。
?? 用戶規(guī)模擴大: 過去一年,Perplexity獲得了1000萬的活躍用戶,回答了超過50億個查詢,致力于解決信息泛濫和人工智能幻覺問題。
科學期刊將引入AI工具Proofig檢測圖片欺詐
科學期刊Science宣布采用商業(yè)軟件Proofig,通過AI檢測圖像篡改,以預防科學研究中的欺詐行為。盡管被視為重要舉措,但軟件仍存在規(guī)避可能性,特別是對于了解其運作方式的欺詐者。科學研究中的圖像篡改是一種常見的欺詐手段,而使用Proofig作為一種自動檢測工具具有一定局限性。
【AiBase提要:】
?? 自動檢測圖像篡改: Science期刊宣布采用商業(yè)軟件Proofig,通過AI自動檢測不當篡改的圖像,防范科學研究中的欺詐行為。
?? 軟件局限性: 盡管Proofig能夠捕捉一些嚴重的圖像篡改案例,但對了解其運作方式的欺詐者仍有規(guī)避可能,且對于精心制作的欺詐圖像可能無法防范。
?? 科學研究欺詐挑戰(zhàn): 預防科學研究中的欺詐行為仍是一個復雜問題,對已發(fā)表可能存在問題的論文,期刊尚未公開其處理方式。
東京大學開發(fā)仿人機器人Alter3能執(zhí)行ChatGPT指令
東京大學的Alter3仿人機器人成功與GPT-4連接,通過將書面指令轉化為可執(zhí)行代碼,實現了機器人模仿各種人類行為,包括彈奏吉他、自拍、扮演角色等。這一實驗為人機交互研究提供了新的方向,但也引發(fā)了一些倫理和道德問題的爭議。
項目地址:https://tnoinkwms.github.io/ALTER-LLM/
【AiBase提要:】
?? Alter3與GPT-4連接: 東京大學成功將仿人機器人Alter3與GPT-4連接,通過語言模型將書面指令轉化為可執(zhí)行代碼,實現機器人模仿人類行為。
?? “啞劇游戲”實驗: 實驗被看作是一場現代化的“啞劇游戲”,語言模型在其中扮演關鍵角色,讓機器人Alter3模仿各種人類動作。
?? 人機交互研究新方向: 這項研究為人工智能領域帶來新的可能性,但也引發(fā)了倫理和道德問題的爭議,涉及機器人的自主性和行為對人類社會的潛在影響。
普林斯頓大學和艾倫科技研究所提出生成引擎優(yōu)化GEO
為了幫助內容創(chuàng)作者更好地理解他們的內容在生成引擎中的表現,并提供了優(yōu)化這些內容以提高其在生成引擎中可見性和有效性的策略,普林斯頓大學和艾倫科技研究所提出了GEO的概念:生成引擎優(yōu)化。
【AiBase提要:】
?? GEO是一種針對生成引擎的印象度量標準,衡量內容在生成引擎回答中的可見性和有效性。
?? GEO的優(yōu)化策略包括結構化內容、關鍵信息突出和增強語義相關性。
?? GEO引入了GEO-BENCH基準測試,用于評估和比較不同優(yōu)化方法的效果。
????????大模型動態(tài)
英偉達發(fā)布文生圖模型TrailBlazer
TrailBlazer是基于預訓練的T2V模型,通過引入邊界框概念,實現對視頻對象運動方向、速度和行為的可控性,無需使用現有視頻或進行神經網絡訓練。支持多對象控制、關鍵幀動畫設置,生成高效且自然的運動效果,為非專業(yè)用戶提供了可行的視頻敘事流程。
項目演示網址:https://top.aibase.com/tool/trailblazer
論文網址:arxiv.org/abs/2401.00896
【AiBase提要:】
?? TrailBlazer發(fā)布: 英偉達推出TrailBlazer,基于預訓練的T2V模型,通過邊界框實現文本到視頻生成的可控性。
?? 無需視頻指導: 無需提供低級別的每幀指導,通過邊界框控制視頻對象運動方向、速度和行為,無需神經網絡訓練。
?? 多對象控制與關鍵幀動畫: 支持同時控制多個對象,通過關鍵幀設置定義對象的位置和動作,生成高效且自然的運動效果。
美圖大模型上線
MiracleVision(奇想智能)正式上線,用戶可在美圖旗下產品和官網體驗,同時,公司向行業(yè)客戶開放模型能力,通過API、SDK、SaaS等形式助力多場景工作流。
【AiBase提要:】
?? MiracleVision上線: 美圖公司推出自研AI視覺大模型MiracleVision,可在美圖產品和官網體驗。
?? 用戶體驗功能: 用戶可在美圖秀秀和WHEE中嘗試文生圖、圖生圖、模型訓練等多項功能。
?? 開放模型能力: 公司向行業(yè)客戶全面開放MiracleVision的模型能力,通過API、SDK、SaaS助力企業(yè)降本增效。
谷歌多模態(tài)圖像生成模型Instruct-Imagen 整合LLM和SD生態(tài)
Instruct-Imagen引入多模態(tài)指令,支持多種模態(tài)任務。模型能夠更好地理解和執(zhí)行任務。
論文地址:https://browse.arxiv.org/html/2401.01952v1
【AiBase提要:】
??谷歌Instruct-Imagen模型整合LLM和SD生態(tài)系統(tǒng)。
??Instruct-Imagen引入多模態(tài)指令,支持多種模態(tài)任務。
??Instruct-Imagen調整多模態(tài)指令,適應各種任務。
騰訊推出語音識別大模型
騰訊云ASR最新升級增強了方言處理、噪聲過濾和語義識別能力,能夠識別23種地方言、處理方言混戰(zhàn)、提高讀音相似詞準確性,并在噪聲環(huán)境中提高識別精準度。已廣泛應用于多場景,包括錄音質檢、會議實時轉寫和語音輸入法等。
體驗地址:https://cloud.tencent.com/product/asr
【AiBase提要:】
??? 方言處理升級: 騰訊云ASR可識別23種地方言,通過多語言混合識別引擎處理方言混戰(zhàn),包括少數民族小方言。
?? 語義識別提升: 使用大語言模型LLM,上下文語義和大數據提取意圖,增強對讀音相似詞和專業(yè)術語的準確識別。
??? 噪聲過濾改進: 通過自主學習和優(yōu)化算法,提升抗干擾能力,自動過濾噪聲,提高識別精準度。
Hugging Face文生成圖模型aMUSEd
Hugging Face團隊開發(fā)的aMUSEd模型在AI圖像生成方面具有較快的速度,能在幾秒鐘內生成圖像。
aMUSEd 項目體驗網址:https://top.aibase.com/tool/aamused
【AiBase提要:】
?? aMUSEd是Hugging Face開發(fā)的一款AI圖像生成模型,能在幾秒鐘內生成圖像,比其他競爭對手更快。
?? aMUSEd采用了輕量級的文本到圖像模型,基于Google的MUSE模型,并使用了Masked Image Model(MIM)架構,提高了生成速度和可解釋性。
?? aMUSEd還可以進行零樣本的圖像修復,具有很高的定制性和控制性。
南洋理工開源創(chuàng)新性文生視頻模型FreeInit
他們發(fā)現視頻擴散模型在生成視頻時存在時間一致性不足和不自然的動態(tài)效果。FreeInit通過多次迭代重復采樣優(yōu)化過程,提升低頻信息質量,改善生成視頻質量。
開源地址:https://top.aibase.com/tool/freeinit
論文地址:https://arxiv.org/abs/2312.07537v1
【AiBase提要】
創(chuàng)新性文生視頻模型FreeInit通過重新初始化噪聲,改進時間的一致性。
研究人員發(fā)現視頻擴散模型的推理初始化噪聲中低頻信息很難被完全移除。
FreeInit通過多次迭代重復采樣優(yōu)化過程,提升低頻信息質量,改善生成視頻質量。
??????AI應用
谷歌似乎正在開發(fā)一款需要付費的 “高級版” Bard
根據開發(fā)者的分享,谷歌似乎正在開發(fā)"Bard Advanced",該版本整合了Gemini Ultra語言模型,具備高級數學和推理能力。
【AiBase提要:】
?? Bard Advanced開發(fā): 谷歌可能推出"Bard Advanced",整合Gemini Ultra語言模型,具備高級數學和推理能力。
?? 自定義機器人功能: 發(fā)現名為Motoko的功能,允許用戶創(chuàng)建自定義機器人,尚不清楚是否需要付費或能否分享。
?? Power Up和Gallery功能: 谷歌可能推出"Power Up"功能,利用AI擴展和改進用戶輸入給Bard的提示。還可能推出Gallery部分,用于探索不同主題。功能尚未正式推出,谷歌未回應是否發(fā)布。
?????????聚焦開發(fā)者
Activepieces:開源全能自動化工具,可定制且易用
Activepieces是一個開源的全能自動化工具,被視為流行的自動化平臺Zapier的替代品。具備用戶友好的工作流構建器、廣泛的集成、開放的生態(tài)系統(tǒng)和無限的使用案例。
在線地址:https://www.activepieces.com/
項目地址:https://top.aibase.com/tool/activepieces
【AiBase提要:】
??? 全能自動化工具: 支持分支、循環(huán)和拖放功能,可輕松創(chuàng)建和管理自動化工作流。
?? 廣泛集成支持: 擁有80多種集成,包括Google Sheets、OpenAI、Discord、RSS等,支持持續(xù)增長,用戶可方便整合其他應用和服務。
?? 開放生態(tài)系統(tǒng): 所有集成源代碼公開,用戶和開發(fā)者可查看、修改和擴展集成,版本直接發(fā)布到https://npmjs.com,提供靈活、易用、可定制的自動化解決方案。
(舉報)