新京报客户端

好新闻 无止境

立即打开
突破新领域,深度求索发布文字识别模型DeepSeek-OCR
新京报 记者 罗亦丹 编辑 岳彩周
2025-10-20 20:30

新京报贝壳财经讯(记者罗亦丹)北京时间10月20日,DeepSeek(深度求索)在开源社区Hugging Face上发布了新模型DeepSeek-OCR。据了解,OCR(Optical Character Recognition,文字识别)模型是一种用来从图像中提取文本的技术。



DeepSeek还上传了与该模型相关的论文,在论文中,DeepSeek-OCR被描述为是“一项关于通过光学二维映射来压缩长上下文可行性的初步研究。”实验表明,当文本标记数量在视觉标记数量的10倍以内时(即压缩比 < 10倍),该模型可以达到97%的解码(OCR)精度。即使在20倍的压缩比下,OCR 准确率仍能保持在约60%的水平。这对于长上下文压缩、大语言模型中的记忆遗忘机制等研究领域展现了相当大的潜力。


编辑 岳彩周

校对 柳宝庆

来阅读我的更多文章吧
罗亦丹
新京报记者
记者主页
相关推荐
半个月十连发,这次不一样了
新京号
半个月十连发,这次不一样了
新京号
北京大模型万马奔腾,从少数人的“玩具”到大多数人的“生产工具” 正在迈向AI普惠新时代
新京号
可灵3.0系列模型正式上线 真实感和叙事能力全面升级
新京号
全民“养龙虾”时代,我们为什么写作?
文化
新闻8点见丨中关村论坛年会开幕;中东战火下的华人撤离
时事
AI for Science悖论:成就科学家,却伤害科学
新京号
2026,北大祝你新年快乐!
新京号
重磅!2025年国内十大科技新闻揭晓
新京号
中华人民共和国国民经济和社会发展第十五个五年规划纲要
第一看点

新京报报料邮箱:82708677@bjnews.com.cn