良い画像の説明を作成する方法

画像の説明とは画像についてのテキストによる説明で、代替テキストaltテキストなどとも呼ばれます。画像の説明は、目の不自由な方や弱視の方、ユーザー補助テクノロジーをご利用の方、低帯域幅の地域にお住まいの方、さらなる背景情報を求めている方の一助となります。

X上の画像の説明には、X以外での場合と比べて次の3点が違います。

  1. Xでの画像説明の文字数上限は1,000文字です。
  2. 画像の説明は、画像を説明することができる唯一の場所です。
  3. 誰でも活用できます。

画像の説明で目指すべきは、簡潔明瞭な文にすること、そしてツイートにさらなる背景情報を提供することです。 

ここでは、良い画像の説明を作成するための推奨事項を例とともに一覧にまとめてあります。

画像の説明の推奨事項

一覧

詳細と例

 

1. 大事な内容を盛り込む

アクション、動き、関係、注目すべき要素、見た目の詳細など、独創的な点を必ず盛り込むことが重要です。

人物、ペット、物、それらの名前(関連する場合)、またそれらの関係性を明記しましょう。トピックの関連性に応じて、人物の人種、性別、年齢などについても言及できます。 

1.
左手に座っているのはうちの子犬のベアトリックス。右手にあるのはこの子が引き裂き終えたばかりの木炭袋です。床に散らかっているのは炭の塊や袋の切れ端と、この子の赤いタコのおもちゃです。

この画像に付ける説明の例:

左手に座っているのはうちの子犬のベアトリックス。右手にあるのはこの子が引き裂き終えたばかりの木炭袋です。床に散らかっているのは炭の塊や袋の切れ端と、この子の赤いタコのおもちゃです。

これで90文字です。

 

2. 簡潔明瞭にして詳しく

画像の説明の文字数制限は1,000文字です。これまでのユーザー補助テクノロジー(スクリーンリーダーなど)のなかには、読み上げを200~250文字で打ち切るものがありました。このようなことは起こらなくなったとはいえ、説明文を簡潔にすることは引き続き重要です。

2.
丸みのある取っ手付きの白いエスプレッソカップに入った、薄い茶色のクレマが浮かぶエスプレッソのショット。マグカップは白いソーサーに載せて木製テーブルの上に置かれています。

この画像の長めの説明の例(116文字):

丸みのある小さな取っ手が付いた小ぶりの白いマグカップに入った、深みのある茶色のエスプレッソのショット。その表面には薄い茶色のクレマが浮かんでいます。中くらいの茶色の木製テーブルの上で、マグカップは小さな白いソーサーに置かれています。

この画像の短めの説明の例(84文字):

丸みのある取っ手付きの白いエスプレッソカップに入った、薄い茶色のクレマが浮かぶエスプレッソのショット。マグカップは白いソーサーに載せて木製テーブルの上に置かれています。

この短めの例は32文字短くなっています。

 

3.  客観的に

自撮り画像の場合や、起きていること自分がしっかり把握している画像の場合を除き、脚色したり、起きていることに解釈を加えたりはしないようにします。読者があなたのツイートとその画像との関連がわかる程度の客観的背景を提供するに留めます。 

例えば、嫌いな政治家の画像に「愚かそうな小顔」のような説明は付けません。「唇を閉じたまま、カメラ目線で笑みを浮かべている」のような説明を付けます。

3.
3人の男性が、すっかり雪に覆われた丘のてっぺんで、クッションの敷かれていない籐カウチに座って笑みを浮かべている。冬物のコートを着て、手袋をはめ、濡れたジーンズと雪まみれの靴をはいている。背後には工場が建っており、丘のふもとには人がそりを手に集まっている。

この画像に付ける説明の例:

3人の男性が、すっかり雪に覆われた丘のてっぺんで、クッションの敷かれていない籐カウチに座って笑みを浮かべている。冬物のコートを着て、手袋をはめ、濡れたジーンズと雪まみれの靴をはいている。背後には工場が建っており、丘のふもとには人がそりを手に集まっている。

これで127文字です。男性たちが楽しそうにしている、と主観的に表現する代わりに、笑みを浮かべている、と表現できます。これで楽しそうだという含みを持たせられます。また、画像に写っている男性たちはカウチをそり代わりにして丘を下ろうとしているように見えます。ですが、実際にそうしているわけではありません。そうしているかのように説明すると、画像の説明の域を超えて、画像からストーリーを創作していることになります。

 

4.  画像内のテキストを書き出す、または要約する

画像にテキストが含まれている場合は、それを説明に含めます。文字数が1,000文字を超えるテキストの場合は、できるだけ要約して、ツイートに関連する内容に焦点を当てます。 

例えば、法的な文書の場合は、内容を要約し、原典へのリンクを画像の説明にではなくツイートに張ります。

ツイートの内容に応じて、画像の説明から一部詳細を省略するという手もあります。こうすることでも、内容が冗長にならないようにできます。例えば、ツイートで著者の名前と書名に触れている場合、その情報を画像の説明で繰り返す必要はありません。    

4.
メアリー・オリバー著の「Dog Songs」という本を開いて持っている手見えている詩のタイトルは「The Poetry Teacher」です。反対側のページには、草の上に横たわるビーグル犬のイラストがあります。この詩には、著者が大学にかけあって詩のクラスを飼い犬同伴で講義できるようになったいきさつが詠まれています。

この画像に付ける説明の例:

メアリー・オリバー著の「Dog Songs」という本を開いて持っている手。見えている詩のタイトルは「The Poetry Teacher」です。反対側のページには、草の上に横たわるビーグル犬のイラストがあります。この詩には、著者が大学にかけあって詩のクラスを飼い犬同伴で講義できるようになったいきさつが詠まれています。 

これで156文字です。ここでは画像に現れていない背景情報が説明に加えられています。背景情報をツイートで紹介していないのでこうしています。

 

5. 頭字語や略語に注意する

頭字語は大文字で表記してください。そうしないと、スクリーンリーダーによっては単語として読むことがあり、文脈にそぐわなくなりかねません。また、文字で読む場合にも、大文字表記になっていない頭字語は読みづらくなります。

略語については、できるだけ略さないようにしましょう。スクリーンリーダーは略語をわかりやく読み上げるとは限りません。 

例えば、"Dr."は"doctor"の略ですが、スクリーンリーダーによってはこれを単語としては読まず、文字をそれぞれ読み上げます。そのため、"Dr. Calvin"は、"ディーアール カルビン"と読み上げられます。それでわかる場合や実際の意味を推測できる場合もありますが、そうではない場合もあります。例外は、画像に出現している略語を書き出す場合です。

その説明を読んだ誰もが特定の略語の意味をわかっているとは限りません。話したり読んだりする言語が違う利用者は、意味を理解するのに苦労するかもしれません。 

5.
12月の初頭にLexington Avenue沿いにあるDoctor Calvinのオフィスの前を通りすぎる2人の若い女性の白黒写真。2人とも冬物のコートに身を包んでいる。

この画像に付ける説明の例:

12月の初頭にLexington Avenue沿いにあるDoctor Calvinのオフィスの前を通りすぎる2人の若い女性の白黒写真。2人とも冬物のコートに身を包んでいる。 

これで84文字です。略語を使用できた可能性のある言葉は、「Doctor」「Avenue」です。省略せずに書かれた言葉は、説明を損なうことも、文字数に大きな影響を与えることもありません。 

 

6. 画像の種類の詳細を含める

画像が接写、空撮、白黒の場合はその旨を記載します。 

芸術作品の場合は、絵画、肖像画、彫刻、イラストなど、その種類を記載します。特定のジャンルに関連がある場合は、それについても記載します。例えば、単に「イラスト」とするのではなく「アニメのイラスト」とします。

6.
丘の上から谷間を覗いた眺め。写真の左右にわたって穀物の畝が続く。夕日が畑を黄色ではなく黄金色に染め上げる。畑の先のなだらかな丘には何軒かの建物と樹木。その先にはさらに急峻な丘があり、長く平らにたなびく層雲の影に一部覆われている。

この画像に付ける説明の例:

丘の上から谷間を覗いた眺め。写真の左右にわたって穀物の畝が続く。夕日が畑を黄色ではなく黄金色に染め上げる。畑の先のなだらかな丘には何軒かの建物と樹木。その先にはさらに急峻な丘があり、長く平らにたなびく層雲の影に一部覆われている。

これで115文字です。やや長めですが、画像の内容を喚起させる説明になるよう心がけられています。 

 

7. 一般的な文構造や大文字・小文字の区別を使う

特徴を箇条書きにするのではなく、文にまとめます。自然に、あるいは会話的に響くような文にします。

英語の場合は標準の文章スタイルを使用し、すべて小文字やすべて大文字を避けます(頭字語や略語を除く)。 

7.
どんよりと曇った寒い日にポルトガルのシントラで撮った街のひとこま。ツアーバスが通りを走りすぎ、カップルがスクーターを降り、何人かがこちらへ向かって歩いている。遠くの山の上にムーアの城跡(カステロ・ド・ムーロ)が見える。

この画像に付ける説明の例:

どんよりと曇った寒い日にポルトガルのシントラで撮った街のひとこま。ツアーバスが通りを走りすぎ、カップルがスクーターを降り、何人かがこちらへ向かって歩いている。遠くの山の上にムーアの城跡(カステロ・ド・ムーロ)が見える。

これで109文字です。 

 

8.  情報が冗長にならないようにする

「~の写真」や「~の画像」を含めないようにします。ユーザー補助テクノロジーはそれが画像であることを認識して利用者に伝えます。ただし、画像がスクリーンショットの場合はその旨を記載します。この場合は有益な背景情報となりえます。

ツイートに入力した情報を画像の説明で繰り返さないようにします。例えば、ツイートで本のカバーの写真を共有し、著者の名前と書名に触れている場合は、その情報を画像の説明では繰り返さず、ブックカバーだという説明をします。その情報をツイートで触れていない場合は、説明に加えます。

8.
@Twitterによる10月4日の「hello literally everyone」というツイートのスクリーンショット118,400件のコメント、784,200件のリツイート、330万件のいいねが付いている。

この画像に付ける説明の例:

@Xによる10月4日の「hello literally everyone」というツイートのスクリーンショット118,400件のコメント、784,200件のリツイート、330万件のいいねが付いている。 

これで103文字です。手短で、興味を引きます。 

 

9.  込み入ったビジュアルに配慮する

図、グラフ、表、地図、インフォグラフィックには詳細な情報が含まれています。こうしたビジュアルにはしばしば長い画像の説明を必要とします。この場合の説明の目的は、トレンドや知見を述べることであり、その背後にある調査を説明することではありません。調査については、ツイートに原典のリンクを追加して、必要であれば詳細情報にアクセスできるようにします。

地図の場合は、表示されている全体的な情報を説明します。インターフェイスのコントロールやピン留めされているランドマークの説明は不要です。

9.
「CDC Disability & Health Data System」の2019年のデータマップのスクリーンショット。18歳以上の成人について何らかの障がいと年収$15,000未満との関係を示している。22.2~50.3% という最も高い割合で見られている州はCA、NM、AR、LA、AL、SC、DC、グアム、プエルトリコ。18.7~22.1% という2番目に高い層に属する州はNE、OK、TX、MO、WI、IN、KY、TN、MS、WV、GA。17~18.6% という中位層の州はAZ、MT、KS、IL、MI、OH、FL、VA、NY、RI。15.6~16.9% という2番目に低い層に属する州はWA、NV、ID、HI、IA、VT、NH、MA、ME、DE。10.2~15.5% と最も低かった州がAK、OR、UT、WY、CO、ND、SD、MN、PA、MD、NC。NJとヴァージン諸島についてはデータなし。米国の中央値は19.7%。地図では各州のパーセンテージとの関係を青と緑で色分け。

この画像に付ける説明の例:

「CDC Disability & Health Data System」の2019年のデータマップのスクリーンショット。18歳以上の成人について何らかの障がいと年収$15,000未満との関係を示している。22.2~50.3% という最も高い割合で見られている州はCA、NM、AR、LA、AL、SC、DC、グアム、プエルトリコ。18.7~22.1% という2番目に高い層に属する州はNE、OK、TX、MO、WI、IN、KY、TN、MS、WV、GA。17~18.6% という中位層の州はAZ、MT、KS、IL、MI、OH、FL、VA、NY、RI。15.6~16.9% という2番目に低い層に属する州はWA、NV、ID、HI、IA、VT、NH、MA、ME、DE。10.2~15.5% と最も低かった州がAK、OR、UT、WY、CO、ND、SD、MN、PA、MD、NC。NJとヴァージン諸島についてはデータなし。米国の中央値は19.7%。地図では各州のパーセンテージとの関係を青と緑で色分け。

これで433文字です。このデータマップの全体的な理解に十分な説明になっています。 

この記事を共有する