突破新领域，深度求索发布文字识别模型DeepSeek-OCR

新京报记者罗亦丹编辑岳彩周

2025-10-20 20:30

新京报贝壳财经讯（记者罗亦丹）北京时间10月20日，DeepSeek（深度求索）在开源社区Hugging Face上发布了新模型DeepSeek-OCR。据了解，OCR（Optical Character Recognition，文字识别）模型是一种用来从图像中提取文本的技术。

DeepSeek还上传了与该模型相关的论文，在论文中，DeepSeek-OCR被描述为是“一项关于通过光学二维映射来压缩长上下文可行性的初步研究。”实验表明，当文本标记数量在视觉标记数量的10倍以内时（即压缩比 < 10倍），该模型可以达到97%的解码（OCR）精度。即使在20倍的压缩比下，OCR 准确率仍能保持在约60%的水平。这对于长上下文压缩、大语言模型中的记忆遗忘机制等研究领域展现了相当大的潜力。

编辑岳彩周

校对柳宝庆

来阅读我的更多文章吧

罗亦丹

新京报记者

记者主页