kuromoji

How to split Japanese text?

限于喜欢 提交于 2021-01-27 17:16:25
问题 What is the best way of splitting Japanese text using Java? For Example, for the below text: こんにちは。私の名前はオバマです。私はアメリカに行く。 I need the following output: こんにちは 私の名前はオバマです 私はアメリカに行く Is it possible using Kuromoji? 回答1: You can use java.text.BreakIterator. String TEXT = "こんにちは。私の名前はオバマです。私はアメリカに行く。"; BreakIterator boundary = BreakIterator.getSentenceInstance(Locale.JAPAN); boundary.setText(TEXT); int start = boundary.first(); for (int end = boundary.next(); end != BreakIterator.DONE; start = end,