安霸CV75S AI SoC 将视觉语言模型和视觉Transformer引入相机

2024-04-25  

安霸(Ambarella) 一直在扩展其 AI SoC 产品组合,最新是 CV75S 系列 5nm 芯片。 该公司声称,该系列推出了最具成本效益和能效的 SoC 选项,用于运行最新的基于人工智能的图像处理,例如安全、机器人、会议和运动相机中的视觉语言模型 (VLM) 和视觉转换器网络。


CV75S 系列是安霸产品线中首款集成最新 CVflow 3.0 AI 引擎的产品,其性能是上一代产品的 3 倍。 CVflow 3.0是基于对计算机视觉核心算法的深刻理解而设计的芯片架构。 它具有专用的视觉处理引擎,安霸使用高级算法描述对其进行了编程,并可与 Tensorflow、Caffe 和 PyTorch 配合使用。 该引擎使 SoC 能够每秒执行数TOPS操作,而功耗仅为领先 GPU 和通用 CPU 解决方案的一小部分。


这些芯片还配备了该公司最新一代的图像信号处理器、两个 1.6 GHz Arm Cortex-A76 内核、4Kp30 H264/5 视频编码和 USB 3.2 连接。


安霸营销和业务开发副总裁表示,这一新系列 SoC 将使大众市场产品设计人员能够将最新的视觉转换器技术和 VLM 集成到零样本图像分类和多模态推理中,以进行实时视觉分析。 例如,CV75S芯片可以在摄像机中运行CLIP(对比语言图像预训练)等多模态VLM来实时扫描镜头并提供即时结果,无需在安装前进行培训。


安霸于今年1月推出了N1 SoC系列,这些芯片与新推出的CV75S在AI运算模型上有所不同。 该公司预先移植和优化 N1 芯片,以运行用于多模态视觉分析的 LLM(生成式 AI)和 LLava 模型,这些模型经过训练和微调,可以分析多个视频流(最多 32 个摄像头),例如视频监控解决方案。另一方面,CV75S 将在摄像头内运行经过预训练和微调的多模式 VLM 和视觉变换器网络,以实时识别摄像头输入中的场景和物体等内容。 这些人工智能模型非常适合机器人、无人机和汽车的自主应用,两种芯片的预移植有助于缩短客户的上市时间。

image.png

自动驾驶汽车中的物体检测和识别


与其他安霸人工智能系统一样,CV75S 由 Cooper 开发者平台支持,该平台提供了一个灵活的模块化开发者环境,包括核心、基础、愿景和用户体验,以加快上市时间。


CV75S 目前正在提供样品,安霸计划将这种先进的基于人工智能的图像处理技术引入到各种价位的相机中,以适应不同的应用。

文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。