일하는/AI, ML 5

FastText to spaCy

FastText 는 Facebook에서 만든 word representation과 sentence classification의 효율적인 학습을 위한 라이브러리로, Word2Vec 와 같이 단어를 벡터로 만들어 준다. Word2Vec 과의 가장 큰 차이점은 Word2Vec 은 하나의 단어를 쪼갤 수 없는 단위로 생각한다면, FastText 는 하나의 단어 안에도 여러 단어들이 존재할 수 있다고 가정하여 학습을 진행한다. 또한 한국어를 포함한 157개국 언어에 대한 common crawler 와 wikipedia의 데이터를 학습한 pre-trained model을 제공하고 있다. Install FastText 는 github page를 통해 다운로드 받거나, pip module을 설치하여 사용할 수 있다. ..

일하는/AI, ML 2021.05.25

spaCy

en.wikipedia.org/wiki/SpaCy spaCy - Wikipedia Not to be confused with Scapy. spaCy ( spay-SEE) is an open-source software library for advanced natural language processing, written in the programming languages Python and Cython.[3][4] The library is published under the MIT license and its main develope en.wikipedia.org spaCy는 자연어 처리를 위한 Python 기반의 오픈 소스 라이브러리로, 다음과 같은 기능들을 제공한다. Tokenization Part..

일하는/AI, ML 2021.05.25

GTTS (Google Text to Speech)

gtts.readthedocs.io/en/latest/index.html gTTS — gTTS documentation © Copyright 2014-2020 Pierre Nicolas Durette Revision b36103df. gtts.readthedocs.io gTTS (Google Text-to-Speech) API는 Google에서 제공하는 TTS 서비스로, pip를 이용하여 해당 모듈 설치 후 사용이 가능하다. (해당 모듈은 인터넷 사용이 가능해야 한다) Install 다음 명령어를 사용하여 gTTS 모듈을 설치한다. $ pip install gTTS How to use 아래와 같이 사용이 가능하다. from gtts import gTTS tts = gTTS( text='안녕하세요? 만나서..

일하는/AI, ML 2021.02.03

Rasa NLU Tutorial

Rasa Rasa is the essential platform for creating great AI assistants. With Rasa, all teams can create better text- and voice-based assistants. Rasa provides infrastructure & tools necessary for high-performing, resilient, proprietary AI assistants - that actually help your customers. Python, Tensorflow로 만들어진 오픈소스 머신러닝 프레임워크. 대화형 데이터를 학습하기 위한 기계 학습 기반 접근 방식을 사용한다. 대화형 챗봇을 위한 머신러닝 출로, 다음과 같이 2개의 프..

일하는/AI, ML 2021.01.21

NLTK Tutorial

아래 페이지를 참고하여 작성하였음. datascienceschool.net/03%20machine%20learning/03.01.01%20NLTK%20자연어%20처리%20패키지.html NLTK 자연어 처리 패키지 — 데이터 사이언스 스쿨 NLTK(Natural Language Toolkit) 패키지는 교육용으로 개발된 자연어 처리 및 문서 분석용 파이썬 패키지다. 다양한 기능 및 예제를 가지고 있으며 실무 및 연구에서도 많이 사용된다. NLTK 패키지가 제공 datascienceschool.net NLTK(Natural Language Toolkit) 패키지는 교육용으로 개발된 자연어 처리 및 문서 분석용 파이썬 패키지이다. 다양한 기능 및 예제를 가지고 있으며 실무 및 연구에서도 많이 사용된다. NL..

일하는/AI, ML 2021.01.21