じゃあ、実際にプログラミングで形態素解析をやってみよう

from janome.tokenizer import Tokenizer
t = Tokenizer()
tokens = t.tokenize('白鳥真理子さんは、私の友人です')
for token in tokens:
print(token)

形態素解析結果:

白鳥 名詞,固有名詞,人名,姓,*,*,白鳥,シラトリ,シラトリ
真理子 名詞,固有名詞,人名,名,*,*,真理子,マリコ,マリコ
さん 名詞,接尾,人名,*,*,*,さん,サン,サン
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
、 記号,読点,*,*,*,*,、,、,、
私 名詞,代名詞,一般,*,*,*,私,ワタシ,ワタシ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
友人 名詞,一般,*,*,*,*,友人,ユウジン,ユージン
です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス


こんな感じで、プログラミングで出力した方が文を細かく形態素に分類してくれる。