问题
I am trying to translate text in a column in pandas dataframe which is partly in Japanese and partly in English into English.
This is how my dataset looks
I want to translate the column 'description'
I am using the below code to achieve this:-
raw_data_non_english['translated_text_1'] = raw_data_non_english['description'].apply(translator.translate, dest='en').apply(getattr, args=('text',))
I have described the issue with the translation here Why is Google translator skipping some text in Python?
Another example of the issue is
string = '''Documentation for transport of dangerous products are not completelyManipulace s nebezpečnými látkami/přeprava (Czech Republic) Qn 2.71 Jestliže zařízení odesílá nebezpečné zboží k přepravě po silnici, přeprava zboží podle ADR je doprovázena přepravním dokumentem nebezpečného zboží předepsaným v kapitole 5.4 a požadovanou dokumentací, která má být naložena v přepravních jednotkách, jak je uvedeno v části 8, kapitola 8.1.2 dohody ADR. review - Documentation for transport of dangerous products are not completely'''
translator.translate(string).text
This skips a lot of text in the output. If however, I change the string to a multi line string so that one line is either entirely in English and the other line is some other language like below, the translation is fine.
string = '''Documentation for transport of dangerous products are not completely Manipulace s nebezpečnými látkami/přeprava (Czech Republic) Qn 2.71 Jestliže zařízení odesílá nebezpečné zboží k přepravě po silnici, přeprava zboží podle ADR je doprovázena přepravním dokumentem nebezpečného zboží předepsaným v kapitole 5.4 a požadovanou dokumentací, která má být naložena v přepravních jednotkách, jak je uvedeno v části 8, kapitola 8.1.2 dohody ADR. review - Documentation for transport of dangerous products are not completely'''
translator.translate(string).text
Want to understand how the formatting changes should be applied to column's text before translation
来源:https://stackoverflow.com/questions/54284093/how-to-fix-googletrans-translate-output