大家好,我是Echa。最近有很多粉丝给小编私信留言说离春节越来越近了,关注小编有一段时间了,分享了大大小小开源项目干货,牵涉到各行各业的,唯独没有多少黑科技开源项目呢?比如人脸识别,元宇宙,AI智能,智能车载系统,智能家居等等,说的小编一愣一愣的。
Benchmarks Timings at 240p: - Face locations: 0.0819s - Face landmarks: 0.0029s - Encode face : 0.4879s - End-to-end: 0.5978s Timings at 480p: - Face locations: 0.3257s - Face landmarks: 0.0028s - Encode face : 0.4959s - End-to-end: 0.8203s Timings at 720p: - Face locations: 0.7046s - Face landmarks: 0.0028s - Encode face : 0.4993s - End-to-end: 1.1888s Timings at 1080p: - Face locations: 1.5179s - Face landmarks: 0.0030s - Encode face : 0.4838s - End-to-end: 1.9404s。
大家好,我是Echa。光学字符识别(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即将图像中的文字进行识别,并以文本的形式返回。
先来看下产品效果:本系统纯本地部署,不依赖任何网络资源,断网可用,实现的功能如下: 语音识别:将说话内容精准识别成文字大模型回复:将文字交给llama3做解析和回复语音转化:将llama3 的文字转化成语音播放出来动画播放:将语音结合动画,让动画人物做成相应的动作人脸识别:通过摄