How to fix googletrans translate output?

倾然丶 夕夏残阳落幕 提交于 2019-12-13 21:01:55

问题


I am trying to translate text in a column in pandas dataframe which is partly in Japanese and partly in English into English.

This is how my dataset looks

I want to translate the column 'description'

I am using the below code to achieve this:-

raw_data_non_english['translated_text_1'] = raw_data_non_english['description'].apply(translator.translate, dest='en').apply(getattr, args=('text',))

I have described the issue with the translation here Why is Google translator skipping some text in Python?

Another example of the issue is

string = '''Documentation for transport of dangerous products are not completelyManipulace s nebezpečnými látkami/přeprava (Czech Republic) Qn 2.71 Jestliže zařízení odesílá nebezpečné zboží k přepravě po silnici, přeprava zboží podle ADR je doprovázena přepravním dokumentem nebezpečného zboží předepsaným v kapitole 5.4 a požadovanou dokumentací, která má být naložena v přepravních jednotkách, jak je uvedeno v části 8, kapitola 8.1.2 dohody ADR. review - Documentation for transport of dangerous products are not completely'''

translator.translate(string).text

This skips a lot of text in the output. If however, I change the string to a multi line string so that one line is either entirely in English and the other line is some other language like below, the translation is fine.

string = '''Documentation for transport of dangerous products are not completely Manipulace s nebezpečnými látkami/přeprava (Czech Republic) Qn 2.71 Jestliže zařízení odesílá nebezpečné zboží k přepravě po silnici, přeprava zboží podle ADR je doprovázena přepravním dokumentem nebezpečného zboží předepsaným v kapitole 5.4 a požadovanou dokumentací, která má být naložena v přepravních jednotkách, jak je uvedeno v části 8, kapitola 8.1.2 dohody ADR. review - Documentation for transport of dangerous products are not completely'''

translator.translate(string).text

Want to understand how the formatting changes should be applied to column's text before translation

来源:https://stackoverflow.com/questions/54284093/how-to-fix-googletrans-translate-output

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!