多模态AI概念

发布时间:2025-04-03 16:52  浏览量:5

多模态大模型(Multimodal Large Language Models,MLLM)是一种结合了大型语言模型(LLM)和大型视觉模型(LVM)的深度学习模型,它们能够处理和理解多种类型的数据,如文本、图像和音频,从而在跨模态任务中展现出卓越的性能。

对于多模态输入-文本输出的典型 MLLM,其架构一般包括编码器连接器以及 LLM。如要支持更多模态的输出(如图片、音频、视频),一般需要额外接入生成器。

随着DeepSeek正式开启“开源周”,每天开源一个项目再度引发AI模型的开源潮。与此前推理模型的开源不同,这几天AI模型在多模态领域“卷”了起来。持续火爆的DeepSeek本身就有着多模态框架,越来越多基于DeepSeek的改良版多模态模型涌现。

多模态AI概念,被严重低估的5家企业

第一家:

利欧股份

市净率:1.87

主营业务:机械制造业务和数字营销业务。

公司亮点:为数不多的能够提供一站式整合数字营销服务的机构,利欧数字推出的营销领域大模型「利欧归一」 通过 AI+投放产品的战略布局,致力于以AI 技术来构建新型的投放模式,为广告客户提供研、创、投、销一站式智能体平台。目前,归一智能的AI 技术已充分展现了其强大的应用能力,已与多家知名企业合作,在社交媒体营销方面取得了显著成效。未来,归一智能将为广告主交付全托管的投放或广告素材服务,以 AI 技术,打造下一代广告公司经营范式。

第二家:

天下秀

市净率:2.35

主营业务:红人营销平台业务及红人经济生态链创新业务。

公司亮点:国内领先的红人新经济公司,公司开发的西五街社区平台是公司自主研发建立的专注于国货美妆测评的社区平台,采用多模态技术引入推荐系统,增加更多的推荐维度,有效提升推荐效果。

第三家:

佳都科技

市净率:1.46

主营业务:智能安防、智能化轨道交通、通信增值、服务与集成(含网络及云计算产品和服务、IT综合服务)。

公司亮点:掌握人脸识别、视频结构化、知识图谱、大数据等人工智能核心技术,在上海人工智能实验室发布的多模态大模型榜单 MMBench 中,来自佳都科技中央研究院的TransCore-M超过LLaVA、mPLUG-Owl2、Qwen-VL-Chat 等 20 余个来自世界一流大学和业界大厂的多模态大模型,分别在 4 个榜单中都高居第二。目前,TransCore-M 的模型和推理 demo 已在 huggingface 开源,并开放体验。

第四家:

岩山科技

市净率:3.25

主营业务:互联网信息服务业务、人工智能业务。

公司亮点:公司旗下岩芯数智(RockAI)于近期推出了Yan 1.3多模态群体智能单元大模型。RockAI正在基于Yan架构大模型积极探索与不同终端设备厂商的合作机会,以实现该模型在多种下游设备中的应用,充分发挥群体智能单元大模型的隐私和安全、低延时、可靠性、低成本等竞争优势。

第五家:

捷成股份

市净率:1.83

主营业务:新媒体版权运营及发行。

公司亮点:国内新媒体版权运营龙头,最具实力的音视频整体解决方案提供商,公司研发的AIGC一键成片系统,基于多模态大模型能力,支持自动成片、长视频缩编等多种应用场景,可预设多种模版,有效提升视频生成效率。同时,该工具具备人工干预窗口,让作者可以对结果进行干预,一方面可以让结果更符合作者期望,另一方可以对模型进行持续训练与优化。

今天给大家梳理了4月2日的龙虎榜单,每日的龙虎榜单备受基金、游资、公募、私募等关注、活跃性较大

想掌握第一手最新资讯?赶紧点击@古今瞭望塔精彩内容等您来探!

外部推荐