金融界2024年12月5日消息,国家知识产权局信息显示,中科烽云(武汉)信息科技有限公司申请一项名为“一种用于控制摄像装置的可语音控制和内容识别方法”的专利,公开号 CN 119071625 A,申请日期为2024年9月。
专利摘要显示,本发明公开了一种用于控制摄像装置的可语音控制和内容识别方法,包括如下步骤:S1、接收并解析用户的语音命令,通过语音识别模块将语音命令转换为控制指令;S2、根据控制指令,控制摄像装置的操作,生成图像或视频;S3、通过图像采集模块实时获取图像或视频内容,并将其编码为高维时空感知矩阵,映射到仿射几何代数空间中进行目标检测与场景理解,生成内容识别向量;S4、基于内容识别向量动态调整摄像装置的拍摄参数以适应环境变化;S5、在识别到特定目标或场景时,自动触发预设的操作流程;S6、将内容识别结果与语音指令结合处理,生成操作建议或自动执行操作。本发明实现了摄像装置在复杂场景中的智能化控制和高效拍摄。


