易翻译支持哪些格式的文件？

易翻译支持多种文件格式，包括常见文本与标记（如txt、md、html）、Office文档（doc/docx/xls/xlsx/ppt/pptx）、PDF、图片（支持OCR）、音频与视频（常见编码）、字幕（srt/ass/vtt）及压缩包内常见文件，能在大多数场景下保留排版与时间轴信息，便于学习、会议与出行中快速互译，操作简单、响应迅速

易翻译支持哪些格式的文件？

Table of Contents

先说为什么要关心“格式”

讲清楚格式这个事儿，其实是为了让翻译结果更“靠谱”。文件格式决定了文字是否可直接提取、能不能保留表格、图片里的文字是否要做OCR、音频和视频是否要先做语音识别（ASR）再翻译，字幕又要保留时间轴。忽视格式，就像把菜直接往锅里扔：可能煮熟了，但味道和外形都乱了。

易翻译支持的文件格式一览（概览）

文件类型	常见扩展	适用场景	注意事项
纯文本 / 标记	txt、md、html	笔记、网页片段、Markdown 文档	注意编码（UTF-8优先）与特殊字符
Office 文档	doc、docx、xls、xlsx、ppt、pptx	报告、表格、演示文稿	复杂排版、公式、审阅痕迹需预处理
PDF	pdf	合同、说明书、扫描件或导出文档	可分为可选文本PDF与扫描PDF，后者需OCR
图片	jpg、jpeg、png、bmp、tif 等	拍照取词、截图、海报	文字方向、分辨率影响OCR效果
音频	mp3、wav、m4a、flac、aac、ogg	会议录音、播客、语音留言	背景噪声、采样率、口音影响识别率
视频	mp4、mov、avi、mkv 等常见容器	短视频、教学视频、会议录像	通常先做ASR再翻译；需注意编码和时轴
字幕	srt、ass、vtt	影视、培训课件	保留时间轴、编码应为UTF-8以免乱码
压缩包	zip、rar（视支持情况）	一次性批量上传多个文件	解压后逐个识别格式进行处理

分门别类讲清楚它是怎么处理的（费曼式）

文本与标记文件（txt、md、html）

这些是最“好”处理的：文字是可直接读取的。易翻译会直接提取文本并送入翻译引擎，保留行首、段落和基本标记（比如 Markdown 的标题、列表），html 文件如果需要保留标签结构，会把文本节点挑出来翻译，然后再放回原位。

优点：翻译速度快，结果可直接替换回原文件。
小贴士：保存时选 UTF-8，避免特殊符号或转义字符被误处理。

Office 文档（Word/Excel/PowerPoint）

Office 文件里常常混合文本、表格、图表、页眉页脚和注释。易翻译通常会提取可编辑文本（比如 docx 的文本流），进行翻译后再尝试把翻译文本填回原位置，尽量保留样式和段落结构。

对于 Word：正文、标题、表格内文字、文本框注释等都会尝试处理，但复杂排版（嵌入对象、公式图片）可能需要手动调整。
对于 Excel：单元格为最小单位，翻译后保留表格结构，但公式本身不会被“翻译”为数值，需注意公式与字符串的区分。
对于 PowerPoint：文字框内容通常能保留位置和大小，但字数显著增减可能导致换行和溢出，需要人工微调。

PDF（可选文本PDF 与扫描PDF）

PDF 两类差别很大：一类是可选文本（导出自 Word 等），另一类是图片扫描。前者类似文本处理；后者需要先做 OCR，把图片中的文字识别成可编辑文本，然后再翻译。

可选文本PDF：能够较好地保留版式，但遇到复杂排版（多栏、嵌套表格）时需要检查。
扫描PDF：OCR 会受分辨率、倾斜、字体与背景影响，识别后再翻译，识别准确度决定最终质量。

图片与拍照取词（OCR）

相机拍下的图片里的文字，需要 OCR（光学字符识别）先把像素转成文字。易翻译通常支持常见图片格式并在前端做截图裁切、方向矫正、增强对比度等预处理以提高识别率。

拍照要尽量裁掉无关背景、保证文字清晰、避免强反光和倾斜。
复杂表格和竖排文字会降低识别率，必要时建议拍多张或用扫描件。

音频与视频（ASR + 翻译 + 回写）

音频和视频的翻译流程通常是三步：1) 语音识别（ASR）把语音转成文字，2) 翻译文字，3) 如果需要，把翻译后的文字以字幕或嵌入方式回写到视频中，且尽量保留时间轴。

常见音频格式（mp3、wav、m4a、flac等）通常被支持；视频则先抽取音轨。
噪声、多人对话、口音和行业术语可能降低识别精准度，需要后期校对。

字幕文件（srt、ass、vtt）

字幕文件有时间轴和文本两部分。易翻译会把文本翻译成目标语言，同时尝试保留时间码和格式（例如 ASS 的样式信息）。翻译后要注意行数、每行字符限制和字幕显示长度，必要时需要人工调整时间或分句。

压缩包与批量处理

把多个文件放进压缩包上传，系统会先解压并按文件类型分别处理，适合会议资料打包或课程文件批量翻译。但请注意压缩包权限与大小限制（以应用说明为准）。

如何准备文件以获得更好结果（实操建议）

优先使用可编辑文本：如可能，提供 docx 或可选文本的 pdf，比扫描件更可靠。
编码与语言标注：文本文件尽量 UTF-8，若文件含多种语言，请在上传时标注源语言和目标语言。
清理痕迹与评论：若不需要保留审阅痕迹，建议先接受所有更改并删除注释，避免干扰翻译内容。
图片拍摄技巧：保持光线均匀、文字居中、分辨率高、避免反光与倾斜。
音视频录制：尽量使用近距离麦克风、减少背景噪声并导出常见编码格式，必要时分段处理长录音。
字幕编码：使用 UTF-8，按每行字符限制分割长句，保留时间码格式。

常见问题与故障排除（FAQ）

Q：上传后排版乱了怎么办？
A：先检查是否用了扫描PDF或图片OCR导致识别结果和原版不一致。对 Office 文档建议使用 docx/xlsx/pptx 原文件并在翻译后做人工微调。
Q：字幕时间轴错位？
A：通常是翻译后行数或字符增加导致换行，调整字幕每行字符上限或人为微调时间码即可。
Q：音频识别不准？
A：尝试提升音频质量、去噪或手动分段；对方言/术语可上传参考词表以提高识别与翻译准确度。
Q：PDF文字被识别成图片怎么办？
A：若 PDF 原本可选文本但识别为图片，可能是导出时被扁平化，建议导出源文件或使用高质量OCR。

实例演练：几个典型流程（边做边解释）

示例一：把 Word 报告翻译成英文并保留格式

上传 docx 文件；
选择源语言和目标语言；
系统提取段落和表格文本并翻译；
下载翻译后文档，检查标题层级、表格列宽与文本溢出；
必要时在本地微调字体与排版。

示例二：把会议录音做成中英双语字幕

上传音频或视频文件；
系统执行 ASR 得到时间轴与原文文本；
文本翻译成目标语言，生成对应时间轴的字幕文件（srt/vtt）；
校对关键术语，导出双语字幕或嵌入回视频。

示例三：拍照翻译一页说明书

用“拍照取词”功能拍摄清晰图片；
系统做 OCR，识别并高亮文字区域；
确认识别段落后选择翻译语言；
系统输出翻译并可复制或以图片标注形式返回。

关于编码、大小与兼容性的一些实务建议

尽量使用 UTF-8 编码文本，避免 ANSI 或其它本地编码导致的乱码。
长文档或超大音视频建议分割上传；大多数在线工具对单文件大小有上限。
特殊文件（含宏的 Excel、受保护的文档）可能需要先解除保护或另存为不含宏的版本。
若需要保密或法律合规，上传前请阅读产品隐私政策或采用离线/企业版服务。

小结式的收尾（不过不是总结）

嗯，说了这么多，核心就是两点：一是把可编辑的源文件交给翻译工具，结果会更好更省心；二是复杂格式（扫描件、长音频、多栏PDF、带样式的演示）往往需要一点人工校验。按上面的准备步骤来，很多坑就能避免。

如果你现在正手边有一个文件，试试把最原始、最干净的版本上传；遇到特殊情况（比如公式、敏感合同、专业术语）可以先做小范围测试，看到翻译和格式保留都满意再批量处理。就这么随手试一试吧，实操中会越来越顺手。

易翻译支持哪些格式的文件？

先说为什么要关心“格式”

易翻译支持的文件格式一览（概览）