本文由创业公司DeepGram的CTONoah Shutty分享。DeepGram开放了自己的API,可以让开发者检索音频和视频文件中的语音信息。免费的开发者账号每月有40个小时的上传额度。为什么要这样做?
例子里对流水线进行了配置,通过 pipeline_config 的 format_priority 参数给到 Towhee 一个提示,告诉 Towhee 优先把模型转到 TensorRT 的格式去做推理,如果失败就尝试走 ONNX。