pandocでhtmlをmarkdownのテキストファイルに変換

pandocでできること。

pandocはWindowsのコマンドプロンプトで使えるソフトで、テキストファイルやhtmlをいろいろなデータ形式に変換できます。

  • markdownテキストをhtmlに変換
  • htmlをmarkdownテキストに変換
  • epubへの変換
  • slidy形式のhtmlスライドへ変換

例えばInternet Explorerで「お気に入り」をhtml形式でエクスポートしたものを、サイトの名前とアドレスを並べたmarkdown形式のテキストファイルに変換できます。

[Yahoo! Japan](http://www.yahoo.co.jp/)

[Google](http://www.google.com/)

のようなテキストファイルになります。

htmlをmarkdownテキストへ変換

例えばinput.htmlをoutput.txt(markdown形式)に変換するには:


pandoc -f html -t markdown -o output.txt input.html

とします。

  • -f はfromの意味で、元のデータの形式を指定
  • -t はtoの意味で、変換後の形式を指定
  • -o はoutputで、返還後のファイル名を指定

参考

関連投稿