
FunClip是什么?
FunClip是一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室开源的FunASR Paraformer系列模型进行视频的语音识别,随后用户可以自由选择识别结果中的文本片段或说话人,点击裁剪按钮即可获取对应片段的视频。
- GitHub项目地址:https://github.com/alibaba-damo-academy/FunClip
- 在线体验地址:https://modelscope.cn/studios/iic/funasr_app_clipvideo/summary
FunClip的功能特色
- FunClip集成了阿里巴巴开源的工业级模型Paraformer-Large,是当前识别效果最优的开源中文ASR模型之一,Modelscope下载量1300w+次,并且能够一体化的准确预测时间戳。
- FunClip集成了SeACo-Paraformer的热词定制化功能,在ASR过程中可以指定一些实体词、人名等作为热词,提升识别效果。
- FunClip集成了CAM++说话人识别模型,用户可以将自动识别出的说话人ID作为裁剪目标,将某一说话人的段落裁剪出来。
- 通过Gradio交互实现上述功能,安装简单使用方便,并且可以在服务端搭建服务通过浏览器使用。
- FunClip支持多段自由剪辑,并且会自动返回全视频SRT字幕、目标段落SRT字幕,使用简单方便。
如何使用FunClip?
方法一:在线体验魔搭社区demo
访问魔搭社区体验链接:https://modelscope.cn/studios/iic/funasr_app_clipvideo/summary,按照下方步骤使用:
- Step1: 上传视频或音频文件(或使用下方的用例体验),点击 识别 按钮
- Step2: 复制识别结果中所需的文字至右上方,或者右设置说话人标识,设置偏移与字幕配置(可选)
- Step3: 点击 裁剪 按钮或 裁剪并添加字幕 按钮获得结果
方法二:在本地启动Gradio服务
确保本地已安装Python和Git,在电脑终端执行以下命令。
git clone https://github.com/alibaba-damo-academy/FunClip.git
cd FunClip
python funclip/launch.py
随后在浏览器中访问localhost:7860
即可看到如下图所示的界面,按如下步骤即可进行视频剪辑
- 上传你的视频(或使用下方的视频用例)
- (可选)设置热词,勾选是否使用说话人识别功能
- 点击识别按钮获取识别结果
- 将识别结果中的选段复制到对应位置,或者将说话人ID输入到对应为止
- (可选)配置剪辑参数,偏移量与字幕设置等
- 点击“裁剪”或“裁剪并添加字幕”按钮
数据统计
数据评估
关于FunClip-阿里开源的自动化视频剪辑工具,支持本地部署使用特别声明
本站AI导航站提供的FunClip-阿里开源的自动化视频剪辑工具,支持本地部署使用都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由AI导航站实际控制,在2024年9月11日 上午11:03收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,AI导航站不承担任何责任。
相关导航

MOKI是美图公司推出的AI视频短片创作平台,专注于辅助视频创作者打造动画短片、网文短剧、故事绘本和音乐视频(MV),基于美图自研的奇想大模型(MiracleVision),通过智能剪辑、自动配乐、音效添加和字幕生成等功能,大幅简化视频制作流程,提高创作效率。

Fliki-在线视频生成工具
Fliki 是一种基于 AI 的文本到语音和视频生成工具,输入文案、图片等素材自动帮你生成视频。它利用人工智能和机器学习来产生听起来最接近真人的高质量音频。,Fliki 是一种基于 AI 的文本到语音和视频生成工具,输入文案、图片等素材自动帮你生成视频。它利用人工智能和机器学习来产生听起来最接近真人的高质量音频。

可灵大模型
可灵大模型是快手AI团队自主研发的视频生成大模型,具备强大的视频创作能力,采用3D时空联合注意力机制,能够生成符合物理规律的大幅度运动视频,模拟真实世界特性。可灵支持生成长达2分钟、1080p分辨率的高清视频。

Vizard
Vizard是将长视频转换为社交短视频片段的AI视频编辑工具,支持TikTok、Instagram、YouTube Shorts等平台,Vizard服务超200万创作者和团队。Vizard提供团队协作空间,简化项目管理和分享流程。用户上传视频后,AI自动转录、剪辑并生成设计好的视频片段,支持一键下载和分享,操作简便,无需注册即可免费试用。

D-ID
AI真人口播视频生成工具

寻光
寻光是由阿里巴巴达摩院研发的一站式AI视频创作平台,利用先进的人工智能技术,为用户提供从剧本创作到分镜图设计、角色定制、场景生成以及视频编辑的全流程服务。

魔撰写作
魔撰写作是出门问问旗下「魔音工坊」团队推出的AI写作助手,轻松帮你遣词造句,润色文采,改写文风,提取文案,校对文案,收藏笔记,搜索字词,更有多语种翻译等众多AI创作功能,让你激发创作灵感,文采更上一层楼。

Tora-阿里推出的以轨迹为导向的AI视频生成框架
Tora是阿里巴巴推出的以轨迹为导向的基于扩散变换器(DiT)的视频生成框架,它能够整合文本、视觉和轨迹数据,精确控制视频内容的动态变化,在不同的时间长度、纵横比和分辨率条件下生成高质量的视频。Tora包括轨迹提取器和运动引导融合器,确保生成的视频能够精确地遵循预定义的轨迹,支持不同分辨率和时长的视频制作。,Tora是阿里巴巴推出的以轨迹为导向的基于扩散变换器(DiT)的视频生成框架,它能够整合文本、视觉和轨迹数据,精确控制视频内容的动态变化,在不同的时间长度、纵横比和分辨率条件下生成高质量的视频。Tor…