搜索
当前所在位置:首页 >> 速报

欧洲“DeepSeek”发布了全世界最好的 OCR,网友:蹲蹲中国的免费开源版

发布时间:2025-09-10 03:56:14 作者:fyq 点击:1715 【 字体:

就在刚刚,欧洲那个曾经开源了首个 MoE 模型的发布欧洲初创公司 Mistral AI 在沉寂一段时间之后又出新活。

Mistral 团队发布了一个号称“全世界最好的全世 OCR”的产物 —— Mistral OCR,旨在将一些 AI 难以直接识别的界最粗糙且复杂的文件进行整理,便于 AI 操作识别。友蹲

欧洲“DeepSeek”发布了全世界最好的蹲中<strong>长沙中学爆料推荐</strong> OCR,网友:蹲蹲中国的免费免费开源版

帖子一经发出,评论区瞬间充满了各种夸夸言论,开源但在一众赞美声中,欧洲也不乏一些真正用过产物的发布网友的理智发言。

就比如有网友对 Mistral OCR 的全世产物能力表示认同,但却有点接受不了它的界最产物定价,觉得有点太贵,友蹲并且期待中国 AI 公司早点发布一个类似的蹲中广州医科大学内幕最新开源版本,把价格打下来。免费

欧洲“DeepSeek”发布了全世界最好的 OCR,网友:蹲蹲中国的免费开源版

同时也有网友亲自上手,上传扫描了手写板的内容,但最后识别出的文字结果正确率并不是很高。

欧洲“DeepSeek”发布了全世界最好的 OCR,网友:蹲蹲中国的免费开源版

除此之外,还有被 Mistral 所宣传的“可以识别超多种语言”噱头吸引过来的网友,但使用后却失望的发现它无法识别自己所用语言。

欧洲“DeepSeek”发布了全世界最好的 OCR,网友:蹲蹲中国的免费开源版

尽管 Mistral OCR 目前还存在着一定的局限性,但它的出现确实是一次从字符识别到场景智能的跨越。

从图文到结构化信息的一大步

与传统的 OCR API 不同,Mistral OCR 是一款多模态 API,它不仅可以识别文本中是否嵌入了插图或照片,还会为这些图形元素创建边界框,并将它们包含在输出中。

从 Mistral AI 团队放出的 Demo 影片可以看出,Mistral OCR 能够将图文混排的 PDF 文件转换成结构清晰的 Markdown 格式文件。

例如表格+数字的 PDF 组合。

欧洲“DeepSeek”发布了全世界最好的 OCR,网友:蹲蹲中国的免费开源版

PDF 图片中数学公式的转换。

欧洲“DeepSeek”发布了全世界最好的 OCR,网友:蹲蹲中国的免费开源版

PDF 宣传图片中的印地语。

欧洲“DeepSeek”发布了全世界最好的 OCR,网友:蹲蹲中国的免费开源版

拍得并不方正的论文照片。

欧洲“DeepSeek”发布了全世界最好的 OCR,网友:蹲蹲中国的免费开源版

甚至带有水印的文字也可以轻松识别。

欧洲“DeepSeek”发布了全世界最好的 OCR,网友:蹲蹲中国的免费开源版

从字符识别到场景智能的一大步

除了直观的 Demo 外,Mistral AI 团队还列举了 6 点 Mistral OCR 的绝对优势:

卓越的复杂文档解析能力:Mistral OCR 在理解复杂文档结构方面表现出色,能够精准解析交错的图像、数学公式、表格以及 LaTeX 等高级排版格式。这使其在处理包含图表、图形、公式和插图的科学论文等富文本文档时更具优势。

原生支持多语言与多模态:Mistral OCR 自带多语言和多模态处理能力,能够灵活应对不同语言以及多种类型的内容,无需额外适配。

行业领先的基准测试表现:在多项行业基准测试中,Mistral OCR 均取得优异成绩,充分展示了其强劲的性能和高准确度。

同类产物中处理速度最快:Mistral OCR 采用轻量化架构,处理速度远超同类产物,单节点每分钟可解析高达 2000 页文档。无论在高负载环境还是大规模信息处理中,它都能保持高效运行,确保稳定性能。

创新性的“文档即提示”结构化输出:Mistral OCR 率先引入“文档即提示”概念,使客户能够直接使用文档作为指令,以获取更加精准和定制化的结果。它还能输出 JSON 等结构化格式,便于与后续任务或自动化流程衔接,实现更智能的内容提取。

可选的自托管部署方案:针对信息隐私要求严格的企业或机构,Mistral OCR 提供自托管部署选项,确保敏感信息始终存储在本地基础设施内,满足合规性与保障性需求。

欧洲“DeepSeek”发布了全世界最好的 OCR,网友:蹲蹲中国的免费开源版

团队还将 Mistral OCR 将 Google Document AI、Azure OCR、Gemini 系列模型以及 GPT-4o 的产物性能进行对比。

最终的结果表明,Mistral OCR 在总体准确率、数学公式识别等方面表现优异,特别是在 2503 版本中,各项指标均大幅提升,达到了新的高度。

欧洲“DeepSeek”发布了全世界最好的 OCR,网友:蹲蹲中国的免费开源版

在多语言处理方面,得出的信息更是远远优于 Google Document AI 和 Azure OCR。

欧洲“DeepSeek”发布了全世界最好的 OCR,网友:蹲蹲中国的免费开源版

欧洲也有自己的“DeepSeek”

Mistral AI 是一家位于法国的初创公司,凭借其 AI 助手 Le Chat 和多个基础模型,已被官方视为法国最具前途的科技公司之一,并被认为是唯一有潜力与 OpenAI 竞争的欧洲企业。

Mistral AI 的三位创始人都拥有在全球顶级科技公司中积累的丰富 AI 研究经验。首席执行官 Arthur Mensch 曾在谷歌 DeepMind 部门工作,首席工艺官 Timothée Lacroix 和首席科学家 Guillaume Lample 则曾是 Meta 的核心成员。凭借着强大的工艺背景,Mistral AI 的创始团队带领公司迅速增长。

欧洲“DeepSeek”发布了全世界最好的 OCR,网友:蹲蹲中国的免费开源版

值得一提的是,雷峰网(公众号:雷峰网)得知自 2023 年成立以来,Mistral AI 在筹集资金方面取得了显著成绩,目标是将前沿 AI 工艺普及给每个人,虽然这一目标并未直接挑战 OpenAI,但它强调了公司对于 AI 开放性的坚定支持。

作为 ChatGPT 的替代品,Mistral AI 推出了聊天助手 Le Chat,并在 iOS 和 Android 上成功上线。在发布后仅两周,Le Chat 的下载量便突破了 100 万次,并一度在 iOS App Store 中登顶法国免费下载榜单。

除此之外,截至 2025 年 2 月,Mistral AI 已筹集了约 10 亿欧元(约 10.4 亿美元)的资金,其中包括几轮股权融资和部分债务融资。尤其值得注意的是,在 2023 年 6 月公司发布首批模型之前,Mistral AI 就成功完成了创纪录的 1.12 亿美元种子轮融资,成为欧洲历史上最大的一轮种子融资,当时公司估值达 2.6 亿美元。

参考链接:

https://mistral.ai/fr/news/mistral-ocr

https://x.com/MistralAI/status/1897694143180112096

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

欧洲“DeepSeek”发布了全世界最好的 OCR,网友:蹲蹲中国的免费开源版

阅读全文
相关推荐

出身“企鹅”的“T4大神”,带领小鹅通闯关港交所

出身“企鹅”的“T4大神”,带领小鹅通闯关港交所
每经记者 蔡 鼎 每经编辑 魏文艺8月22日,港交所官网显示,SaaS软件运营服务)解决方案供应商深圳小鹅网络技术有限公司Xiaoe Inc。,以下简称小鹅通,证券简称“XIAOE”)当日向港交所首次 ...

李连杰回应住院:感谢大家的关心 不用太担心我

李连杰回应住院:感谢大家的关心 不用太担心我
#李连杰回应生病住院#【#李连杰回应住院#:#李连杰说感谢大家的关心#】 8月17日,@李连杰 发文回应住院:硬件出了点问题,返厂维修一下。感谢大家的关心🙏不用太担心我~~休息,休息一下。相关新闻病床 ...

人民日报评论:警惕关于纪念抗战的几种错误论调

人民日报评论:警惕关于纪念抗战的几种错误论调
据人民日报报道,今年是中国人民抗日战争暨世界反法西斯战争胜利80周年。近期,围绕抗战话题,一些错误论调混淆视听,值得警惕。一是认为回望过去是在“宣扬仇恨”。因展现日本军国主义的残忍疯狂本性,电影《南京 ...

男子结婚22年发现2个儿子有3个爹!前妻多次拒绝亲子鉴定,21岁大儿子经常回家闹事打人

男子结婚22年发现2个儿子有3个爹!前妻多次拒绝亲子鉴定,21岁大儿子经常回家闹事打人
来源:经视直播山东淄博的姜先生在结婚22年后,通过亲子鉴定发现其与前妻含辛茹苦抚养长大的两名儿子均非自己亲生,这一发现给他带来了巨大的情感冲击。姜先生描述,他跟前妻于2002年12月结婚,2004年前 ...

词作家杨湘粤忆千百惠:不久前还在深圳演出,是几代人的记忆

词作家杨湘粤忆千百惠:不久前还在深圳演出,是几代人的记忆
8月20日深夜,著名歌手千百惠因病去世的消息传遍网络,引发公众追念。当晚,著名词作家杨湘粤向南都N视频记者回忆道,今年6月下旬,千百惠还来到深圳,与周冰倩同台演唱了《走过咖啡屋》。“她是一个乐观、豁达 ...

超10万人爆仓!加密货币为何大幅回调?

超10万人爆仓!加密货币为何大幅回调?
来源:国际金融报加密货币冲高后大幅回调!比特币在8月14日突破历史新高至12.45万美元后持续回调,截至8月19日15时30分,比特币跌破11.5万美元,24小时内跌幅接近3%;以太坊跌破4300美元 ...

部分陆海空基战略重器等将首次展示

部分陆海空基战略重器等将首次展示
国务院新闻办公室今天上午举行新闻发布会,介绍阅兵准备工作有关情况,并答记者问。相关负责人介绍:部分陆海空基战略重器、高超精打、无人和反无人装备,是第一次对外展示。发布会更多要点9月3日阅兵是全面推进中 ...

7月份北京市居民消费价格环比由降转升

7月份北京市居民消费价格环比由降转升
新京报讯 据北京市统计局消息,7月份,北京市居民消费价格环比由降转升,同比降幅较上月小幅扩大。从环比看,CPI环比由上月下降0.4%转为上涨0.7%。其中,食品价格下降0.9%,降幅比上月收窄0.5个 ...

港交所陈翊庭:港交所将研究24小时交易机制

港交所陈翊庭:港交所将研究24小时交易机制
在港交所2025年中期业绩会议上,港交所集团行政总裁陈翊庭表示:“港交所在保持全球竞争力方面始终坚持战略性投入原则。港交所在资本开支方面不会吝啬,我们持续加大在信息平台优化、交易结算系统升级等方面的投 ...

俄罗斯公布解密文件 涉及中国

俄罗斯公布解密文件 涉及中国
俄罗斯联邦安全局公共关系中心19日在该局官网发布的解密文件显示,侵华日军第七三一部队简称731部队)为发动细菌战,不停实施人体实验,甚至用携带病菌的炮弹攻击数百名中国人,以计算感染率、确定致病菌“质量 ...

美司法部调查华盛顿特区警方是否操纵犯罪数据

美司法部调查华盛顿特区警方是否操纵犯罪数据
当地时间8月19日,据消息人士透露,美国司法部正在调查华盛顿特区大都会警察局是否操纵了犯罪数据。当地时间8月18日,特朗普在社交媒体上发文称“华盛顿特区提供虚假的犯罪数据是为了制造一种虚假的安全假象。 ...

黄金48小时过去,北京楼市新政有没有用?

黄金48小时过去,北京楼市新政有没有用?
每经记者|刘颂辉每经编辑|金冥羽 陈梦妤北京五环外某在建项目 每日经济新闻资料图北京楼市新政有没有用?单日网签突破2亿元、48小时到访量突破930组、销售2.8亿元⋯⋯刚刚过去这个周末8月9日~8月1 ...
返回顶部