无问芯穹推出端侧全模态开源模型,为人工智能提供设施
近日,由清华大学电子工程系教授、系主任汪玉发起的清华系初创企业无问芯穹智能科技有限公司推出端侧全模态理解的开源模型Megrez-3B-Omni。
背景:端侧模型的迫切需求
随着人工智能技术不断发展,对设备算力的要求也越来越高。对于移动设备和物联网设备等端侧设备,由于资源有限,对模型计算和存储需求提出了更高要求。而端侧模型则可以快速部署、高效运行在这些设备上,弥补云端模型在端侧应用的不足。
Megrez-3B-Omni:端侧模型的突破性进展
Megrez-3B-Omni是一款参数量为30亿的端侧全模态理解模型,具备图片、音频、文本三种模态数据处理能力。
在文本理解方面,Megrez-3B-Omni将上一代14B大模型压缩至3B规模,降低计算成本,提升计算效率。同时,它还支持中英文语音输入,处理复杂多轮对话场景,并支持对输入图片或文字的语音提问,不同模态间自由切换。
在图像理解方面,该模型在场景理解、OCR(光学字符识别)等任务上可识别并提取文本信息。
技术亮点:软硬件协同优化
Megrez-3B-Omni的突破性进展得益于无问芯穹提出的软硬件协同优化策略。该策略通过优化模型参数与主流硬件的适配性,最大化利用端侧硬件性能。
纯语言模型Megrez-3B-Instruct:单模态模型的领先优势
同时开源的纯语言版本模型Megrez-3B-Instruct为单模态模型,最大推理速度领先同精度模型300%,具备AI搜索功能。
清华团队的科研成果转化
无问芯穹的创始人团队来自清华大学电子工程系NICS-EFC实验室,该实验室早在2008年便投入到面向智能场景的软硬件联合优化技术路线。
联合创始人兼CEO夏立雪表示,Megrez-3B-Omni的推出证明了无问芯穹在模型训练和优化方面的能力。未来,无问芯穹将持续迭代该模型,探索更多端侧人工智能应用场景。
意义:为人工智能提供可及性
Megrez-3B-Omni等端侧模型的推出,为人工智能在端侧设备的应用铺平了道路。未来,随着端侧模型的不断发展,人工智能将变得更加普及和易于使用,为各行各业带来变革性的影响。
原创文章,作者:睿鸿在线,如若转载,请注明出处:https://mip.orihonor.com/2024/12/17/32822.shtml