图像识别

DevMind AI

DevMind AI旨在无缝整合文本、图像、视频、音频和代码等多种模型的推理能力，帮助您像专业人士一样进行开发！DevMind AI通过AI功能增强您的项目。

AIAS

AIAS(AI Acceleration Suite)提供SDK,引擎,标版组件,套装组件加速算法在各业务场景中落地,为集成商赋能,为企业内部项目赋能.

Imagga

Imagga图像识别API是一款强大的计算机视觉人工智能工具，提供图像标记和分类、视觉搜索、内容审核等解决方案。

Apple Create ML

Create ML是一款用于在Mac上创建和训练自定义机器学习模型的工具，支持图像分类、目标检测、手势识别、动作分类、文本分类、声音分类和运动分类等功能。

Image to excel

Image to excel是一款利用人工智能技术，能够识别图片中的表格和文本，并将其转换为可编辑的Excel文件的工具。它支持多种语言，包括英语、简体中文、繁体中文、法语等，并且能够识别多种图像格式，如JPG、PNG等。该工具通过AI技术提供高精度和准确性，支持网页、iOS应用和Android应用，用户可以在线将图片转换为Excel。产品背景信息显示，它是一个小型AI工具，旨在帮助用户轻松地将图片数据转换为电子表格，提高工作效率。目前，该工具提供免费试用，具体价格和定位信息未在页面中明确说明。

Aquila-VL-2B-llava-qwen

Aquila-VL-2B模型是一个基于LLava-one-vision框架训练的视觉语言模型（VLM），选用Qwen2.5-1.5B-instruct模型作为语言模型（LLM），并使用siglip-so400m-patch14-384作为视觉塔。该模型在自建的Infinity-MM数据集上进行训练，包含约4000万图像-文本对。该数据集结合了从互联网收集的开源数据和使用开源VLM模型生成的合成指令数据。Aquila-VL-2B模型的开源，旨在推动多模态性能的发展，特别是在图像和文本的结合处理方面。

海螺视频

海螺AI利用先进的多模态大语言模型，提供智能搜索、创意写作、语音通话等功能，助力学生、职场人士和内容创作者高效工作

DeepSeek-VL2-Tiny

DeepSeek-VL2是一系列先进的大型混合专家（MoE）视觉语言模型，相较于前代DeepSeek-VL有显著提升。该模型系列在视觉问答、光学字符识别、文档/表格/图表理解、视觉定位等多项任务中展现出卓越的能力。DeepSeek-VL2由三种变体组成：DeepSeek-VL2-Tiny、DeepSeek-VL2-Small和DeepSeek-VL2，分别拥有1.0B、2.8B和4.5B激活参数。DeepSeek-VL2在激活参数相似或更少的情况下，与现有的开源密集型和基于MoE的模型相比，达到了竞争性或最先进的性能。

1 23