May 27, 2024|新聞稿

AI即戰力！創鑫智慧協助企業電腦無痛升級

回到選單

【2024年5月27日，台北訊】致力研發高能效AI ASIC（Application Specific Integrated Circuit，特定應用積體電路）的創鑫智慧（Neuchips），將在2024台北國際電腦展（COMPUTEX 2024）推出整合RAG（Retrieval-Augmented Generation，檢索增強生成¹）與LLM（Large Language Model，大型語言模型）的端到端（end-to-end）AI解決方案，搭配企業內部既有硬體系統即可部署本地端GPT節能加速方案，顯著降低企業導入LLM的時間與總擁有成本。該解決方案支援多種開源的中文、英文大型語言模型，包含台灣可信任生成式AI模型TAIDE，讓政府等機敏單位亦可擁有AI賦能優勢。

創鑫智慧執行長劉景慈表示：「我們採用自行研發、台積電7奈米製程製造的ASIC－Raptor生成式AI晶片（原稱N3000），製作成能夠安裝至小型電腦或工作站的Viper生成式AI卡及整合式的LLM解決方案，無須額外投入人力、電力、空間等成本，即可結合軟硬體合作夥伴打造企業專屬應用。」

企業已認知到將AI導入工作流程對於提升生產力的重要性，但其複雜部署方式與大量先期投入成本卻成為企業裹足不前的鴻溝。Viper生成式AI卡使用PCIe介面和電腦連結，擁有半高半寬外型規格體積小巧的優勢，功耗最低僅需35瓦，可直接安裝至既有電腦，或是企業內部負責儲存資料的NAS（Network-Attached Storage，網路附加儲存裝置），進一步強化資料檢索的便利性，更有利於生成式AI發展；該產品甚至支援最多48GB的記憶體空間，可提供企業本地端作為向量資料庫（Vector Database）使用，於單一張生成式AI卡上有效率地完成索取資料、檢索、增強及生成等任務，端對端的運作效率是CPU的10倍以上，加上不須額外連網可離線使用的特色，無須擔心企業敏感資料外洩或是成為資安隱憂。

Viper生成式AI卡內建Raptor生成式AI處理器，能夠大幅度卸載生成式AI工作負載對於CPU的負擔，其中嵌入引擎（Embedding Engine）可強化流程中的向量相似度檢索（Vector Similarity Search）的效率及精準度，一體達成檢索增強與生成等工作，強化流程應用與系統效能最佳化。RAG能夠在不重新訓練LLM的前提下，從外部擷取新資訊並整合，節省大量重新訓練AI模型的時間與成本，同時提升推論準確性並根據企業應用需求進行微調。

創鑫智慧將於2024台北國際電腦展現場，偕同合作夥伴展出最新、最完整的產品陣容，誠摯邀請您蒞臨現場參觀，深入了解我們從設計、晶片，再到產品、軟體等一系列為企業應用打造的AI解決方案，讓您無須投入大量資源，立即輕鬆升級AI！

Computex Banner.png (617 KB)

2024台北國際電腦展－創鑫智慧參觀資訊

l 時間：2024年6月4日至6月7日，上午9：30至下午5：30

l 地點：台北南港展覽館1館4樓（台北市南港區經貿二路1號4樓）

l 展區：AI運算暨系統解決方案區N1301a

回到選單

近期刊登

AI即戰力！創鑫智慧協助企業電腦無痛升級賦能AI PC/AI IPC 的RAG-LLM端到端的節能加速方案 May 27, 2024|新聞稿

意外趕上生成式AI熱潮創鑫智慧搶先秀開源模型應用生成式人工智慧（Generative AI）當道，軟體領域的突破帶動硬體加速升級。創鑫智慧（Neuchips）執行長劉景慈表示，近期客戶詢問度熱烈，團隊的AI晶片工作站已可運作Meta開源模型，將鎖定雲端市場，且可與伺服器廠商一起打天下。 November 02, 2023|新聞稿

創鑫智慧雲端用人工智慧推論晶片在AI世界評測贏得最佳能效比領導地位 RecAccelTM N3000 AI ASIC加速器與系統方案在 MLPerf™ v3.0測試中每瓦效能為對手的1.7倍 April 19, 2023|新聞稿