Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
  • ベストアンサー

Word文書から特定の文字を抜き出すには

Wordの文書内の指定した記号で囲まれた文字、 (例えば、"「"と"」"を指定すると、文書内の「」で囲まれた文字) を全部抜き出して、Excel上に出力したいのですがどうしたらいいのでしょうか? フォルダを指定して、そのフォルダに入ったWord文書を全て検索する。 指定する記号は、「」、【】、『』など5種類ほど、指定する。 このようなことがしたいのですが、書籍などの情報がなくて困っています。 よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • Zz_zZ
  • ベストアンサー率44% (756/1695)
回答No.2

マクロを組めば出来そうですが、文書を1つづつ開かなけ ればならない可能性も有るかもしれません。(良く知りま せん。) ANo.#1 と比べて、帯に短し襷に長し的な方法ですが、ディ レクトリ内文書を全部検索して、その結果をリスト出力で きるようです。 KWIC Centre 2.27 http://plaza3.mbn.or.jp/~h_ishida/KWIC.html  フリー :テキスト検索のみ  シェアー:PDF/WORD/EXCEL等の GREP 検索、\1,000)  ・ファイル検索    正規表現に対応(jre32.dll を使用、DL 可)  ・リスト    検索結果をリスト形式、タブ区切りデータで出力可能。 検索語を、正規表現で指定。例えば、 「.*」.*『.*』.*【.*】 (.* は、正規表現での、いわば、ワイルドカードの指定方 法です。) として検索し、検索結果のテキスト出力(行単位)をし、更 にこれを perl や sed で加工すれば、検索語だけを csv 形式などに出来ます。 テキスト検索機能のみはフリーですので、まず、テキスト ファイルで(.doc から .txt に落として)試して見ても良い と思います。 作者に、検索語だけの出力オプションを依頼する方法もあり ます。

参考URL:
http://plaza3.mbn.or.jp/~h_ishida/KWIC.html
malco-mama
質問者

お礼

こんばんは、ご回答ありがとうございました フリーソフトを早速インストールしました。 最初漢字二字の言葉を検索してみて、スムーズにいき、 CSVファイルに出力して感動していたのですが、 その後、引き続き試そうとすると「サービスが実行中ではありません。」 というメッセージがでて、検索を受け付けてくれなくなりました。 アプリケーションを起動しなおしても同じ状態です。 何故か、もしご存知でしたら教えていただけないでしょうか? よろしくお願いします。

すると、全ての回答が全文表示されます。

その他の回答 (4)

noname#2567
noname#2567
回答No.5

 Officeの中だけで処理するなら、VBAプログラム(Officeのマクロ)を作らなければなりませんね。  Wordで元文書を開いた状態でマクロを起動。  マクロからExcelのオブジェクトを取得して置いて、「」、【】、『』等の並びにマッチングする部分を検索。  検索は、WindowsのRegExpオブジェクトを利用すると簡単に書けると思います。  一つマッチングする度に、マッチした範囲をExcelのセルに複写、次にマッチする箇所を検索・・・これを最後まで繰り返し。  終わったら、ExcelのWorkBookに名前をつけて保存・・・。  こんな感じですかね?  実際にコードを組むにはそれなりに手間なんで、やってはいませんが。(^^;  VBAに関するリファレンスは、各OfficeアプリケーションからVBAエディタを起動し、ヘルプを参照すればそれなりに詳しく書かれていますよ。  MSの各種言語に関する詳細な情報は、MSDN Onlineを参照してみて下さい。  MSがリリースしているありとあらゆる言語やOSの詳細な情報を読む事ができます。 (下のURLは日本語サイトなので、日本語に翻訳されている情報のみです。  英語サイトならば、全ての情報が英語で読めます。)

参考URL:
http://www.asia.microsoft.com/japan/msdn/default.asp
malco-mama
質問者

お礼

こんばんは、ご回答ありがとうございます。VBAだけでもできるのですね。 私はまだVBAの初心者なので、書籍等のサンプルを組み合わせて何とか必要な機能を実現している段階です。 Excel、Accessはいろいろと覚えてきましたが、そのほかのことはあまりわかりません。 今回はWordに関することなので、早速書店にいってみたのですが、WordVBAに関する本は1冊もなくあきらめていました。 VBAで実現できることがわかったので、ヘルプなどでもっと調べてみようと思います。

すると、全ての回答が全文表示されます。
noname#8602
noname#8602
回答No.4

私も、こういった作業は、テキストに落とし、awkやperlで処理する作業だと思います。 Zz_zZさんが例示されたような正規表現を使い、*.txtを入力ファイルにすれば、それこそ、一網打尽のレベルでしょう。 おそらく、「1行野郎」に毛が生えた程度のスクリプトで、CSVまで持っていけると思います。

参考URL:
http://www.fukumi.co.jp/mm/pc/link_scr.htm
malco-mama
質問者

お礼

こんばんは、ご回答ありがとうございました。 恥ずかしながら、「perlって言葉は知っているけど何?」という状態で早速書店で本を買ってきました。 今から読むところです。 今回の仕事に役に立つか(間に合うか)わかりなせんが、今後の課題として取り組みたいと思います。

すると、全ての回答が全文表示されます。
  • Zz_zZ
  • ベストアンサー率44% (756/1695)
回答No.3

ここなどは参考になるでしょうか?

参考URL:
http://search.download.yahoo.co.jp/bin/v_searchf?p=word+%8C%9F%8D%F5
malco-mama
質問者

お礼

ご紹介いただいたソフトKWICの件で、なかなかうまくいかなかったのですが、 教えてくださったURLのサポート掲示板に投稿することにより解決しました。 本当にありがとうございました。

すると、全ての回答が全文表示されます。
  • shota_TK
  • ベストアンサー率43% (967/2200)
回答No.1

一網打尽に移動することはできないと思いますが,ひとつずつ拾うのは簡単です. 「編集→検索」で検索オプションを表示させ,「ワイルドカードを使用する」にチェックを入れます.そして,例えば【】で囲まれた文字列を検索したければ,「検索する文字列のところに【*】と記入します.半角のアスタリスクです.これは,トランプで言えばジョーカーの役割をしますので,【】で囲まれた文字列が全て検索されます. あとは,面倒ですけど,見つけ次第,一度本文に戻ってカット(コピーではなく)し,Ctrl+Endで文末に移動しペーストします.再び検索ウィンドウをクリックして次を検索すれば,割と簡単に【】の文字列を集められると思います.

malco-mama
質問者

お礼

shota_TKさん、早速のご回答ありがとうございました。 大量に文書があるので、VBAの自動処理を想定していたのですが、 やはり一つ一つ検索するしかないのですね。とても残念ですが、地道に頑張ります。

すると、全ての回答が全文表示されます。

関連するQ&A