百度的OCR一直做的非常很不错,PaddleOCR也是业界用的最多的开源模型之一,尤其是中文识别。PP-DocBee 是一款专注于文档理解的多模态大模型,能够识别表格内容,准确提取表格中的信息,如识别奖牌榜表格内各国家的名次、奖牌数量 。
1月10日,澎湃新闻获悉,商汤正式推出 “日日新”融合大模型,深度推理与多模态信息处理能力均大幅提升。不止能达到人类“看”和“想”的水平,还可以解决更多复杂问题,看不清的字体、数据图表里的信息、文学创作与撰写等都可以实现。
科技日报讯 (记者吴纯新 通讯员汪伟颋)3月23日,记者从华中科技大学获悉,由该校联合武汉金山办公软件有限公司研究人员开发的Monkey多模态大模型已被人工智能领域国际顶级会议CVPR 2024接收,且该大模型曾在大模型开源开放评测体系——“司南”多模态大模型排行榜中名列开源模型
当地时间3月9日,据德国科技媒体报道,在一场名为“AI in Focus - Digital Kickoff”的活动上,微软德国公司的首席技术官安德烈亚斯•布劳恩(Andreas Braun)透露了一个重磅消息——GPT-4将于下周正式推出,并提到了一个关键细节,GPT-4将是多