without haste but without rest

[python] 텍스트 데이터 전처리 본문

ProgrammingLanguage/Python

[python] 텍스트 데이터 전처리

JinungKim 2020. 4. 25. 16:33
test = '"yOure,\n'
token = ''.join(ch.lower() for ch in test if ch.isalnum() or ch == "'")

print(token)

 

위 token 한줄로 텍스트 데이터 전처리시에 특수문자, 따옴표, 콤마, 마침표등 다 걸러낼 수 있다.

학교 강의에서 배운 방법인데, 스트링도 시퀀스라는 생각을 평소에 안했던 걸 반성하게 해준 코드다 .. ^^.. 

 

 

Comments