衆院・参院の質問主意書自動要約システムを作る
質問主意書には、現状が羅列され、それに対する疑問提起がなされる、という風になってるから、最も重要そうな現状を文字数が許す限り選んで、疑問提起は必ず含めるって感じになる。
— しょこみんと (@shokomint) 2017年12月18日
まずは、キーワードをピックアップしたい。質問主意書タイトルから時事名詞ピックアップして、さらに、2回以上同質問主意書内にでてくる時事名詞をピックアップ。で、その時事名詞にどのような助詞などの補助用語が使われているかを見て概要を把握する。。みたいなイメージ。
— しょこみんと (@shokomint) 2017年12月18日
参考
IBM「Watson」関連研究チームが取り組む文書の自動要約システム--品質は人レベルにも https://t.co/1qlkCQLd8J @zdnet_japanさんから
— しょこみんと (@shokomint) 2017年12月18日
今は重要分抽出のみだけじゃなくて、オリジナル文章を別の文章に置き換えるってことができるみたいね。別の文章に置き換える必要はないんだよね。。たまーに短い単語に置き換えたりもするけど、いる・いらないの判定さえできればいい。https://t.co/8fHBZA4wUJ
— しょこみんと (@shokomint) 2017年12月18日
うーん、IBMワトソンの論文、全部読めてないけど、基本的には、単語の頻度判定と、辞書による言い換えっぽいな。。https://t.co/znmArmHHkY
— しょこみんと (@shokomint) 2017年12月18日
ニュースを3つのポイントに要約するサービス。https://t.co/C9TLYSs7ki
— しょこみんと (@shokomint) 2017年12月18日