실습을 통해 출력한 그래프는 다음과 같다. 어떻게 코드를 작성해야 하는지는 아래 상세히 설명을 할 것이니 그래프 개형만 참고하자! 0. 실습 전 준비 다음은 예제에서 이용할 엑셀 파일이다. 원하는 경로에 저장하여 실습에서 이용할 수 있도록 하자. 이번에는 데이터를 시각화하기 위해 Matplotlib를 이용할 것이다. pandas가 관계형 데이터를 다루는데 사용하는 라이브러리라면, Matplotlib는 그 데이터들을 시각화 하는데 이용되는 라이브러리이다. 저번 포스팅에서와 동일하게 pandas와 Matplotlib를 이용하기 위해서 전처리기를 통해 import 해줘야 한다. import pandas as pd import matplotlib.pyplot as plt 1. 데이터 불러오기 우리가 분석하고자 ..
0. 실습 전 준비 다음은 예제에서 이용할 엑셀 파일이다. 원하는 경로에 저장하여 실습에서 이용할 수 있도록 하자. 먼저 pandas를 이용하기 위해서 전처리기를 통해 import 해줘야 한다. 여기서 pandas는 관계형 데이터를 다루는데 이용하는 library이다. import pandas as pd 1. 데이터 불러오기 우리가 분석하고자 하는 .csv 확장자 파일을 불러오기 위해 다음과 같은 코드를 작성해야 한다. data1 = pd.read_csv('./data/chicken_07.csv') pd.read_csv('file directory 경로') : directory 경로에 입력된 파일을 불러옴 본 예제에서는 불러온 파일을 data 변수에 할당해 이용할 것이다. 2. 데이터 출력 아래와 같이 ..
데이터셋 저장경로 "root/data/raw" intent 각 인텐트 단위로 파일을 분할 파일명과 intent명이 동일 파일명은 한글로 해도 상관 없긴 하지만, 리눅스 운영체제의 경우 시각화시 matplotlib에 한글폰트가 설치되어있지 않다면 글자가 깨지니, 가급적이면 시각화를 위해 영어로 하는 것을 권장 entity - 라벨 라벨링 오류 오류 1 파주 유명한 공연장 알려줘,S-LOCATION O S-PLACE O 파주 유명한 공연장 알려줘 - question에 해당 S-LOCATION O S-PLACE O - label에 해당 question과 label의 크기는 동일해야함(크기는 띄어쓰기로 구분된 텍스트의 개수) 그렇지 않으면 오류 메시지 발생 오류 2 kochat_config 파일 내에 있는 DA..
from urllib.parse import quote_plus from bs4 import BeautifulSoup from selenium import webdriver baseUrl = 'https://www.google.com/search?q=' plusUrl = input('무엇을 검색할까요? : ') url = baseUrl + quote_plus(plusUrl) #위에서 input을 한글로 받는데, 한글은 인터넷 기본 Url에서 사용하는 형식이 아니므로 quote_plus를 통해 바꿔줌 # '파이썬'이라고 입력했을 때 plusUrl 부분이 '파이썬'이라는 한글이 아닌 코드로 출력됨 https://www.google.com/search?q=%ED%8C%8C%EC%9D%B4%EC%8D%AC dr..