为深入贯彻落实全国检察长会议“推动数字检察深化升级”部署要求,北京检察机关依托与有关单位共建的“生成式人工智能检察应用联合实验室”(以下简称联合实验室),由东城区检察院联合有关单位共同研发“光学字符识别模型强化学习优化方法及装置”专利技术,于2026年5月获国家知识产权局发明专利授权,系北京检察机关首例成功申报的专利。
非结构化数据(即无固定格式、结构不规则的数据)处理效率与效果是影响数智赋能检察效能的重要因素。光学字符识别(OCR)技术可快速识别非结构化数据,大幅提高数据处理效率。目前主流的OCR算法主要包括传统OCR小模型、图文多模态大模型。东城区检察院在“老年人权益保护”大模型场景体系化建设中,需对依法获取的大量非结构化数据进行处理,但现有OCR技术存在三方面难题。一是语义理解偏差。多模态大模型具备较强的语义理解能力,但易输出语义合理但不符合事实的内容,导致输出结果后,仍需反复溯源核查,严重影响工作效率。二是关键信息被印章或签名遮挡。部分数据虽然字体较清晰,但关键信息被印章或签名遮挡,影响数据提取的准确性。三是小模型对复杂场景适应性不足。传统OCR小模型具有速度快、轻量化的优势,但对复杂场景适应性差,针对检察机关依法调取的格式多样的数据,传统模型难以准确定位需要提取的信息位置,导致输出结果不符合业务需求。
针对以上问题,联合实验室创新提出“基于事实奖励增强的OCR大模型强化学习优化方法”,通过引入语义一致性、逻辑事实校验等奖励机制(即通过对模型输出结果进行反馈、调整,保障结果准确性)改进算法,成功研发本专利,将非结构化数据的识别准确率提升8.8个百分点,达到97.6%,显著优于行业平均水平,为破解传统技术短板贡献检察智慧。目前专利技术已在支撑公益诉讼检察“养老助餐点专项监督”、民事检察“公告送达专项监督”等领域办案方面取得成效。