본문 바로가기

Python4

enumerate e.g. t = [1, 3, 7, 10] for e in enumerate(t): print(e) #튜플 형대로 반환 for i, e in enumerate(t): print(i, e) 출력 (0,1) (1,3) (2,7) (3,10)0 1 1 3 2 7 3 10 2022. 11. 2.
최대공약수, 최소공배수 w. 유클리드 호제법 최대공약수 GCD(greatest common divisor) 유클리드 호제법: x와 y의 최대공약수 == y와 r의 최대공약수 (r = x%y) e.g. x = 10, y = 12 x y r 10 % 12 == 10 y r 12 % 10 == 2 반복해서 10 % 2 == 0 r이 0이 될 때의 y가 최대공약수, 따라서 2가 최대공약수 코드 def GCD(x,y): while(y): x, y = y, x%y return x 내장함수 이용 import math math.gcd(x,y) 최소공배수 LCM(least common multiple) (x*y) / (x와 y의 최대공약수) 코드 def LCM(x, y): result = (x*y)//GCD(x,y) return result 내장함수 이용 impo.. 2022. 11. 2.
[NLP] 자연어 전처리 https://angiekang.tistory.com/27 정규표현식 post를 읽고 보시는 것을 권장합니다. 3. 전처리 이메일 제거 홍길동 abc@gmail.com 연락주세요! -> 홍길동 연락주세요! re.sub(r"[a-zA-Z0-9+-_.]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+", "", text).strip() strip() : 좌우 공백 제거 함수 해쉬태그 제거 대박! #맛집 #JMT -> 대박! re.sub(r"#\S+", "", text).strip() 멘션 태그 제거 @홍길동 감사합니다! -> 감사합니다! re.sub(r"@\w+", "", text).strip() URL 제거 주소: www.naver.com -> 주소: text = re.sub(r"(http|http.. 2022. 4. 11.
[Python] 정규표현식 1. 정규표현식 1. 메타문자 [ ] 문자 클래스. [ ] 사이의 문자들과 매치 e.g. [abc] 가 주어진다면 a , b , c 한개의 문자만 있으면 매치 before은 b를 포함하므로 매치 [a-zA-Z] : 알파벳 모두 ^ : not [^0-9] : 숫자가 아닌 문자만 매치 \d : 숫자 = [0-9] \D : 숫자가 아닌 것 = [^0-9] \s: whitespace = [ \t\n\r\f\v] \S : whitespace 아닌 것 = [^ \t\n\r\f\v] \w : 문자+숫자 = [a-zA-Z0-9_] \W : 문자+숫자가 아닌 것 = [^a-zA-Z0-9_] Dot(.) \n 를 제외한 모든 문자와 매치 a.b : a + 모든문자 + b aab(매치), a0b(매치), abc(매치X) a.. 2022. 4. 11.