Python

I analyzed 1000 articles about Python

I started studying the Python programming in March 2020.
Since then, I have reviewed and collected thousands of PDF articles, as well as more than a thousand links to articles.
This is, so to speak, my learning path and knowledge base.

I try analyzed all the texts from 1000 collected articles about Python (dataset – https://airtable.com/shrNtoOfPJVDcO3fG/tblAYr9pYzqpWhYJ0).
And here’s what I found.

Pyxtract

Create my first open source project – Pyxtract

Create my first open source project – Pyxtract:
https://github.com/skupriienko/Pyxtract

Python module for extracting texts from thousands of URL and/or PDF:

– Download and parsing articles from URLs
– Extract texts from local PDF files
– Analyze texts
– NLP preprocessing
– Visualization
– Word clouds
– Name Entity Recognition

Найпопулярніші слова в вакансіях Python Developer

Найпопулярніші слова в вакансіях Python Developer

Найпопулярніші слова в вакансіях Python Developer, які я автоматично зібрав своїм Pyxtract із кількох українських job-сайтів (вибірка за 19.09.2020). На фото кожен рядок це вакансія

Така собі табличка “бінго”. Куди ж без Experience 🙂

До речі:
– середня кількість знаків на вакансію – 1500.
– загалом у вакансіях від 1000 до 2100 знаків.
– середня кількість слів – 160 (від 100 до 225 слів).
– у вакансіях переважає нейтральна або позитивна емоційна тональність, але різні вакансії суттєво відрізняються між собою в цьому.

Ukrainian Stopwords (українські стоп-слова)

Ukrainian Stopwords

Довго шукав список українських стоп-слів (Ukrainian Stopwords) для відсіювання зайвих слів при аналізі текстів.
Зустрічалися в інеті не зовсім повні. Вирішив створити свій, але найбільший з існуючих:

– https://github.com/skupriienko/Ukrainian-Stopwords