without haste but without rest
[python] 텍스트 데이터 전처리 본문
test = '"yOure,\n'
token = ''.join(ch.lower() for ch in test if ch.isalnum() or ch == "'")
print(token)
위 token 한줄로 텍스트 데이터 전처리시에 특수문자, 따옴표, 콤마, 마침표등 다 걸러낼 수 있다.
학교 강의에서 배운 방법인데, 스트링도 시퀀스라는 생각을 평소에 안했던 걸 반성하게 해준 코드다 .. ^^..
'ProgrammingLanguage > Python' 카테고리의 다른 글
[python] 알파뱃 리스트 (0) | 2020.07.10 |
---|---|
[python] Counter 함수 (0) | 2020.05.18 |
[python] 자잘한 not 사용법 (0) | 2020.04.24 |
[python] random 라이브러리 (0) | 2020.04.13 |
[python] sort 메소드, sorted 함수에서 lambda 활용하기 ★ (0) | 2020.04.03 |
Comments