動画テロップの作り方には、感覚ではなく数値で決められる実務基準があります。文字数は横書き1行13文字(全角)以内・最大2行、表示速度は1秒あたり4文字まで(Netflix「Japanese Timed Text Style Guide」)、文字と背景のコントラスト比は4.5:1以上(W3C「WCAG 2.1」2018年勧告)が出発点です。 公共の場では69%の人が音声オフで動画を視聴し、80%が「字幕があれば最後まで見る可能性が高まる」と回答(Verizon Media・Publicis Media共同調査、2019年4月、米国成人5,616人対象)しており、テロップの可読性は視聴維持率に直結します。本記事では、文字数・配色・タイミング・フォントの4領域を「そのまま使える数値ルール」として整理し、公開前チェックリスト10項目まで落とし込みます。
動画テロップとは
動画テロップとは、動画の画面上に重ねて表示する文字情報のことで、発話内容を文字化する「字幕(フルテロップ)」と、要点や感情を強調する「演出テロップ」の2種類に大別されるものです。テレビ業界由来の言葉ですが、現在はYouTube・TikTok・Instagram Reelsなどのショート動画でも標準的な編集要素になっています。
テロップの目的は装飾ではなく「情報の到達」です。音声が聞けない環境の視聴者に内容を届け、聞ける環境の視聴者には理解を補強する。この目的から逆算すると、テロップ品質の評価軸は「読めるか(可読性)」「読み切れるか(表示時間)」「視線を奪いすぎないか(情報設計)」の3つに絞られます。本記事はこの3軸に沿って実務ルールを解説します。
なぜテロップが視聴維持を左右するのか:データで確認する
まず、テロップに編集時間を投資する根拠をデータで押さえます。
Verizon MediaとPublicis Mediaの共同調査(2019年4月、米国18〜54歳の成人5,616人対象)では、次の結果が報告されています。
- 69%が公共の場で音声オフのまま動画を視聴する(自宅などプライベートな場でも25%が音声オフ)
- 80%が「字幕があれば動画を最後まで見る可能性が高まる」と回答
- 字幕利用者の80%は聴覚に障害のない人
つまり字幕・テロップは、聴覚サポートという狭い役割を超えて、視聴者の大半に作用する「完視聴の装置」として機能しています。
広告領域でも同様の結果があります。Meta(旧Facebook)が2016年2月に発表した社内テストでは、字幕付きの動画広告は視聴時間が平均12%増加しました。同社はこの結果を受けて動画広告の自動字幕生成機能を導入しています。
日本国内の視聴環境を見ても、動画はすでに全世代のメディアです。総務省「令和6年度情報通信メディアの利用時間と情報行動に関する調査報告書」(2025年6月公表)によると、YouTubeの利用率は全年代で80.8%、TikTokは33.2%(10代では65.7%)、Instagramは52.6%に達し、平日のインターネット平均利用時間は181.8分とテレビ視聴(154.7分)を上回ります。移動中・店舗内・職場など音声を出せない場面での視聴が日常化している以上、「テロップなしの動画は視聴者の一部にしか届かない」と考えるのが実務的です。国内の利用実態データの全体像は公開データで見る日本のSNS・動画利用実態にまとめています。
ルール1:文字数とレイアウト「1行13文字・最大2行」
文字数の基準として参照すべきは、世界190カ国以上に配信するNetflixが制作パートナー向けに公開している「Japanese Timed Text Style Guide」です。同ガイドラインは日本語字幕の上限を次のように定めています。
| 項目 | Netflix日本語字幕の基準 | スマホ縦型ショート動画での実務目安(当社推奨) |
|---|---|---|
| 1行の文字数(横書き) | 最大13文字(全角) | 8〜10文字 |
| 1行の文字数(縦書き) | 最大11文字(全角) | 縦書きは原則使わない |
| 行数 | 最大2行 | 1〜2行 |
| 表示速度 | 1秒あたり4文字まで | 同左(1秒4文字) |
| 聴覚障害者向け字幕(SDH) | 1行16文字・1秒7文字まで | — |
出典:Netflix「Japanese Timed Text Style Guide」(Netflix Partner Help Center掲載)
横長のテレビ画面を前提とした基準が「13文字×2行」である点に注意してください。スマホ縦画面(9:16)は表示幅が狭く、同じ文字数でも1文字あたりの表示サイズが小さくなるか、画面を覆う面積が大きくなります。当社が中小企業のショート動画制作を支援してきた経験では、縦型動画は1行8〜10文字・最大2行に収めると、初見の視聴者でも読み落としがほぼ起きません。
文字数を収めるための実務テクニックは3つです。
- 文節の切れ目で改行する — 「今日は新商品の/紹介をします」のように、意味のまとまりで切る。単語の途中で改行しない。
- 助詞・冗長表現を削る — 「〜ということなんです」→「〜です」。話し言葉をそのまま文字にせず、要約して載せる。
- 2枚に分割する — 2行に収まらないセリフは、無理に詰めず2枚のテロップに分ける。
また、レイアウトでは「セーフゾーン」の確保を徹底します。TikTok・Reels・Shortsはいずれも画面下部にキャプションやアイコン、右側にいいね・コメントなどのUIが重なります。テロップは画面の中央〜やや下に置き、画面の最下部と右端には配置しないのが原則です。プラットフォームごとのUI仕様は変わるため、投稿前に実機プレビューで重なりを確認する工程をチェックリストに組み込みます。
ルール2:配色「コントラスト比4.5:1以上」
テロップの配色は、好みの色を選ぶ作業ではなく、コントラスト比を確保する作業です。
Webアクセシビリティの国際基準であるW3C「WCAG 2.1」(2018年勧告)は、文字と背景のコントラスト比について、通常サイズの文字で4.5:1以上、大きな文字(18pt以上または太字14pt以上)で3:1以上を求めています。これはWebページ向けの基準ですが、「人間が文字を読み取れる明度差」の根拠として動画テロップにもそのまま応用できます。コントラスト比はWebAIMなどの無料チェッカーで色コードを入力すれば数秒で計測できます。
ただし動画特有の問題として、背景の明るさがフレームごとに変わります。白背景のシーンでは読めた白文字が、次のカットで読めなくなる。これを防ぐのが「縁取り」と「座布団(背景帯)」です。
| 配色パターン | 構成 | 特徴 | 主な用途 |
|---|---|---|---|
| 白文字+黒縁取り | 白+縁2〜4px | どんな背景でも読める万能型 | フルテロップ(セリフ字幕) |
| 黒文字+白縁取り | 黒+縁2〜4px | 明るい映像で安定 | 屋外・白背景の多い動画 |
| 白文字+半透明黒座布団 | 白+黒帯(不透明度50〜70%) | 可読性が最も安定するが映像を隠す面積大 | 情報量の多い解説動画 |
| 黄色文字+黒縁取り | 黄+黒縁 | 強調・感情表現に向く | 演出テロップ(1動画1〜2色まで) |
| 背景色と同系色の文字 | — | コントラスト不足で読めない | 使用しない |
配色ルールの要点は2つです。第一に、ベースは「白+黒縁」または「黒+白縁」の2択に固定し、背景依存をなくすこと。第二に、強調色は1動画につき1〜2色に制限することです。当社の制作実務でも、強調色を赤・黄・青と3色以上使った動画は「どこが重要か」が逆に伝わらなくなる傾向が一貫して見られます。色で強調するのは1文に1箇所まで、と決めておくと編集判断が速くなります。
なお、色覚多様性への配慮として、赤と緑の組み合わせで意味を区別する表現(赤=NG・緑=OKなど)は、色だけでなく「×」「○」の記号や文言を併記して伝わるようにします。
ルール3:タイミング「1秒4文字」で表示時間を決める
テロップが「読み切れない」最大の原因は、表示時間の不足です。基準は前述のNetflix「Japanese Timed Text Style Guide」が定める表示速度、**1秒あたり4文字(全角)**です。テロップの文字数を4で割れば、必要な表示秒数が機械的に決まります。
| テロップの文字数 | 最低表示時間(1秒4文字基準) | 用途の目安 |
|---|---|---|
| 4文字 | 1.0秒 | 一言リアクション(「えっ!?」など) |
| 8文字 | 2.0秒 | 短いセリフ・見出し |
| 13文字(1行上限) | 約3.3秒 | 1行フルのセリフ |
| 20文字(2行) | 5.0秒 | 2行のセリフ・説明 |
| 26文字(2行上限) | 6.5秒 | 上限。これ以上は2枚に分割 |
この表から逆算すると、60秒のショート動画に載せられる文字数は、テロップが常時表示されていても最大240文字程度です。台本段階で「この動画で文字にできる情報量」の上限が見えるため、テロップ設計は編集工程ではなく台本工程から始まると考えるのが実務的です。
タイミング設計では、文字数換算に加えて次の3点を徹底します。
- 発話と同時に出す — テロップが声より遅れると、視聴者は「読む」と「聞く」の二重処理を強制され、ストレスで離脱します。音声波形に合わせてイン点を打ちます。
- カットをまたがない — テロップ表示中に画面が切り替わると視線がリセットされます。原則、1テロップ=1カット内で完結させます。
- 冒頭2秒に最重要テロップを置く — ショート動画はおすすめフィード型で、冒頭の数秒が視聴継続を左右する設計だと各プラットフォームが公式に説明しています。動画の結論や視聴メリットを冒頭テロップで提示します。冒頭設計の詳細はショート動画の作り方で解説しています。
ルール4:フォントと装飾の実務基準
フォント選びにも判断基準があります。
- 書体はゴシック体(サンセリフ)を基本にする。 明朝体は線が細く、スマホの小画面では背景に溶けやすいため、使うなら太めのウェイト+縁取りを徹底します。
- ウェイト(太さ)はMedium〜Boldを使う。 細いウェイトは縁取りをしても可読性が落ちます。
- 1動画で使うフォントは2種類まで。 セリフ用と強調用で分け、それ以上増やさない。
- 商用利用可のライセンスを確認する。 法人の動画は商用利用にあたるため、フォントのライセンス規約の確認を制作フローに組み込みます。無料で商用利用できる日本語フォントとしては、Googleが提供するNoto Sans JPなどのオープンソースフォントが定番です。
- 過度なアニメーションは避ける。 1文字ずつ飛び跳ねるような動きは読む速度を奪います。フェードまたはポップ程度の控えめな表示にとどめ、動きで目立たせるのは1動画1〜2箇所までにします。
当社が中小企業の動画運用を支援してきた経験では、テロップ品質のばらつきは「担当者のセンス」ではなく「テンプレートの不在」から生まれています。フォント・サイズ・配色・位置・表示速度を1枚のテンプレートに固定してしまえば、編集経験の浅い担当者でも一定品質を再現でき、編集時間も短縮されます。逆に毎回ゼロから装飾を考える運用は、時間がかかるうえに品質も安定しません。
公開前チェックリスト10項目
ここまでのルールを、公開前に確認するチェックリストに落とし込みます。編集完了後、投稿前に5分で確認できる構成です。
- □ 1行13文字(縦型は8〜10文字)以内に収まっているか
- □ 2行を超えるテロップがないか(超える場合は分割したか)
- □ 表示時間は「文字数÷4秒」を下回っていないか
- □ 文字と背景のコントラスト比4.5:1以上を縁取り・座布団で確保したか
- □ 強調色は1〜2色に収まっているか
- □ テロップがプラットフォームUI(下部キャプション・右側アイコン)と重なっていないか(実機プレビューで確認)
- □ 発話とテロップのタイミングがずれていないか
- □ テロップがカットをまたいでいないか
- □ 冒頭2秒に結論・視聴メリットのテロップがあるか
- □ 音声オフで再生して内容が伝わるか(最終確認)
特に10番目の「音声オフ再生」は、テロップ品質の最終テストとしてそのまま機能します。音を消して通しで見て、内容が伝わらない箇所がテロップの改善ポイントです。テロップ以外も含めた動画全体の公開前確認には、無料の動画公開前チェックリストもあわせて活用してください。
ROI試算:テロップ改善は割に合うか
テロップの作り込みには編集時間がかかります。投資に値するかを試算します(以下は仮定を置いた計算例です)。
- 前提:60秒のショート動画を月4本内製。テロップなしの編集時間は1本3時間、フルテロップ+本記事のルール適用で1本5時間(+2時間)
- 編集担当の人件費を時給2,500円と仮定すると、追加コストは1本5,000円、月4本で20,000円
- 月間総再生数を8,000回と仮定。Verizon Media・Publicis Media調査(2019年)の「80%が字幕があれば最後まで見る可能性が高まる」という結果を踏まえ、完視聴率の改善でおすすめ配信が伸び、平均再生数が25%改善したと仮定すると月10,000回
この場合、追加コスト20,000円で月2,000回の再生増、1再生あたり10円の獲得単価です。さらにテンプレート化が進めば追加編集時間は2時間から1時間以下に圧縮され、単価は下がり続けます。改善幅は仮定ですが、「音声オフの視聴者69%に内容が届いていなかった」状態を解消する施策である以上、テロップは数ある編集テクニックの中でも投資対効果を見込みやすい領域です。逆に、ここを省いた動画は配信アルゴリズム上も不利になります。アルゴリズムの評価指標はYouTube ShortsとInstagram Reelsの解説記事を参照してください。
よくある失敗3つ
- 話した言葉を一言一句そのまま載せる — 話し言葉は冗長です。「えっと」「〜という感じで」を削り、1秒4文字で読み切れる分量に要約します。
- スマホ実機で確認せずPCのプレビューだけで公開する — PCの大画面で読めてもスマホでは読めないことがあります。投稿前のスマホ実機確認を徹底します。
- 動画ごとにデザインを変える — テロップのデザインはアカウントの「番組フォーマット」です。毎回変えると視聴者の学習が働かず、編集時間も増えます。テンプレートに固定し、変えるのは中身だけにします。
まとめ:今日やるべきことは3つ
動画テロップの作り方は、①文字数(1行13文字・縦型は8〜10文字・最大2行)、②配色(コントラスト比4.5:1以上を縁取りで確保)、③タイミング(1秒4文字・発話同期・カットをまたがない)の3つの数値ルールに集約されます。出典のある基準に沿ってテンプレート化すれば、センスに頼らず品質を再現できます。
今日やるべきことは次の3つです。
- 直近の自社動画を音声オフで再生する — 内容が伝わらない箇所を書き出し、改善対象を特定する。
- テロップテンプレートを1枚作る — フォント・サイズ・配色・位置・表示速度を固定し、編集ソフトにプリセット保存する。
- 公開前チェックリスト10項目を制作フローに組み込む — 投稿前5分の確認を運用ルール化する。
「ルールは分かったが、月数本の制作と運用を回す時間がない」という場合は、外部の力を借りるのも選択肢です。当社では企画・撮影・編集(テロップ設計を含む)から投稿後の分析・改善提案までを一貫して行うショート動画制作サービスを提供しています(ショート動画1本150,000円〜、月額ライトプラン月4本450,000円、月額プレミアムプラン月8本900,000円・税抜)。
