AI/ fit_pipeline.ipynb
2022-08-28 11:16:54 +03:00

1179 lines
122 KiB
Plaintext
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

{
"cells": [
{
"cell_type": "code",
"execution_count": 1,
"id": "10e636e2-5f38-43cb-adc6-b2f928d61136",
"metadata": {},
"outputs": [
{
"name": "stderr",
"output_type": "stream",
"text": [
"/home/ubuntu/venv/lib/python3.8/site-packages/tqdm/auto.py:22: TqdmWarning: IProgress not found. Please update jupyter and ipywidgets. See https://ipywidgets.readthedocs.io/en/stable/user_install.html\n",
" from .autonotebook import tqdm as notebook_tqdm\n"
]
}
],
"source": [
"import torch\n",
"import numpy as np\n",
"from transformers import AutoTokenizer, AutoModel\n",
"from tqdm import tqdm\n",
"tqdm.pandas()\n",
"\n",
"import matplotlib.pyplot as plt\n",
"import seaborn as sns\n",
"sns.set()\n",
"import numpy as np\n",
"\n",
"import pandas as pd\n",
"import docx\n",
"import os\n",
"import re\n",
"\n",
"device = 'cuda'"
]
},
{
"cell_type": "code",
"execution_count": 2,
"id": "19c1e5b6-30d7-4684-87be-2777cc14006c",
"metadata": {},
"outputs": [],
"source": [
"#word preprocessing functions\n",
"\n",
"import nltk\n",
"from nltk.tokenize import word_tokenize\n",
"\n",
"from nltk.corpus import stopwords\n",
"from nltk.stem import SnowballStemmer\n",
"from nltk.tokenize import word_tokenize\n",
"\n",
"russian_stopwords = stopwords.words(\"russian\")\n",
"\n",
"russian_stopwords.append('российской')\n",
"russian_stopwords.append('федерации')\n",
"russian_stopwords.append('федерального')\n",
"russian_stopwords.append('настоящих')\n",
"russian_stopwords.append('соответствии')\n",
"russian_stopwords.append('также')\n",
"russian_stopwords.append('рф')\n",
"russian_stopwords.append('ред')\n",
"\n",
"russian_stopwords.append('субсидии')\n",
"russian_stopwords.append('предоставления')\n",
"\n",
"\n",
"def lowercase(text):\n",
" return str(text).lower()\n",
"\n",
"def clean_symb(text):\n",
" return re.sub(r'[^\\w]', ' ', text)\n",
"\n",
"def clear_token(text):\n",
" return word_tokenize(text)\n",
"\n",
"def clean_stopwords(token):\n",
" return ' '.join([i for i in token.split(' ') if i not in russian_stopwords])\n",
"\n",
"def clean_stem(token):\n",
" return [st.stem(i) for i in token]\n",
"\n",
"### combo 3 prev\n",
"def make_clean(s):\n",
" return ' '.join(clean_stem(clean_stopwords(clear_token(s))))"
]
},
{
"cell_type": "code",
"execution_count": 3,
"id": "193b640f-d312-440c-9c89-5cb868132e2c",
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"162"
]
},
"execution_count": 3,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"#find all docs\n",
"\n",
"data_path = './data/Документы/'\n",
"documents = os.listdir(data_path)\n",
"documents = [data_path+d for d in documents]\n",
"len(documents)"
]
},
{
"cell_type": "code",
"execution_count": 4,
"id": "f8dfdf00-ef42-411c-b629-a1fb349c5c94",
"metadata": {},
"outputs": [],
"source": [
"#load and parse doc functions\n",
"\n",
"from nltk.corpus import stopwords\n",
"from nltk.stem import SnowballStemmer\n",
"from nltk.tokenize import word_tokenize\n",
"\n",
"\n",
"def get_text(filename):\n",
" doc = docx.Document(filename)\n",
" fullText = ''\n",
" for para in doc.paragraphs:\n",
" for run in para.runs:\n",
" fullText+=run.text\n",
" fullText+='\\n'\n",
" return fullText\n",
"\n",
"def split_text(text):\n",
" texts, groups = [],[]\n",
" regt = re.findall(r\"{(.*?)}(.*?){(.*?)}\",text.replace('\\n',''))\n",
" for t in regt:\n",
" if t[0]==t[-1]:\n",
" texts.append(t[1])\n",
" groups.append(int(t[0]))\n",
" else:\n",
" print(t)\n",
" \n",
" return texts, groups"
]
},
{
"cell_type": "code",
"execution_count": 5,
"id": "8fdc799a-6ee7-4188-9c70-39b0c11a5833",
"metadata": {
"collapsed": true,
"jupyter": {
"outputs_hidden": true
},
"tags": []
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"('36', '42. ', '37')\n",
"('37', ' (в ред. Правительства РФ от 04.05.2021 N 699) 43. ', '38')\n",
"('38', ' 48.', '7')\n",
"('10', '6. ', '24')\n",
"('24', ' 7. ', '11')\n",
"('11', '8. ', '10')\n",
"('13', 'м) ', '10')\n",
"('10', '(пп. \"о\" в ред. Правительства РФ от 16.08.2021 N 1337)9. ', '13')\n",
"('13', '(в ред. Правительства РФ от 16.08.2021 N 1337)12. ', '11')\n",
"('11', ' ', '24')\n",
"('24', ' ', '17')\n",
"('17', '14. ', '21')\n",
"('21', '15. ', '15')\n",
"('15', '(в ред. Правительства РФ от 16.08.2021 N 1337)16. ', '22')\n",
"('22', ' 17. ', '21')\n",
"('21', '18. ', '28')\n",
"('28', ' ', '12')\n",
"('12', ' ', '30')\n",
"('28', '', '30')\n",
"('30', 'ж) утратил силу. - Правительства РФ от 16.08.2021 N 1337.19. ', '23')\n",
"('23', ' 20. ', '13')\n",
"('12', ' 21. ', '13')\n",
"('13', ' 22. ', '22')\n",
"('22', '23. ', '11')\n",
"(' 11', ' 24. ', '11')\n",
"('11', '25. ', '21')\n",
"('21', 'ж) утратил силу. - Правительства РФ от 16.08.2021 N 1337.26. ', '24')\n",
"('24', ' 28. ', '27')\n",
"('27', ' ', '22')\n",
"('22', '29. ', '24')\n",
"('24', ' 31. ', '37')\n",
"('37', ' (в ред. Правительства РФ от 16.08.2021 N 1337)32. ', '38')\n",
"('38', ' (в ред. Правительства РФ от 16.08.2021 N 1337)33. ', '35')\n",
"('2', ' сведения об организационной структуре реализации исследовательской программы, планы по изменению организационно-штатной структуры организации, на базе которой реализуется исследовательская программа, в целях обеспечения эффективной и независимой реализации исследовательской программы; ', '12')\n",
"('11', ' отказ от участия в конкурсе. ', '15')\n",
"('21', ' недостоверность информации, содержащейся в представленных организацией документах, указанных в настоящих Правил; ', '2')\n",
"('38', ' В случае установления в ходе проверок, проведенных Министерством науки и высшего образования Российской Федерации и (или) органом государственного финансового контроля, фактов нарушения целей, условий и порядка предоставления гранта средства гранта в размере, определенном на основании выявленных нарушений, подлежат возврату в доход федерального бюджета: ', '238')\n",
"('27', 'Результатом предоставления грантов является количество завершенных проектов открытых библиотек, размещенных в открытом доступе в информационно-телекоммуникационной сети \"Интернет\" и предоставляемых любым лицам на условиях безвозмездной бессрочной открытой лицензии, завершенных технологических проектов и проектов по акселерации, по которым завершена акселерационная программа. ', '22')\n",
"('36', ' при получении кредита по льготной процентной ставке направлять ежеквартально в Министерство строительства и жилищно-коммунального хозяйства Российской Федерации актуальную информацию об имеющихся депозитах и иных финансовых документах. ', '136')\n",
"('10', 'даты размещения результатов отбора на едином портале и на сайте http://favt.ru/ в сети \"Интернет\", которая не может быть позднее 14-го календарного дня, следующего за днем определения победителя отбора (принятия решения о заключении договора о предоставлении субсидии или об отказе в заключении договора). ', '7')\n",
"('10', ' наименование производителей, с которыми заключается соглашение, и размер предоставляемой субсидии. ', '11')\n",
"('37', ' Министерство промышленности и торговли Российской Федерации и органы государственного финансового контроля проводят проверки соблюдения производителем целей, условий и порядка предоставления субсидии, которые предусмотрены настоящими Правилами. ', '35')\n",
"('30', ' оплата услуг по переводам документов, аудиторских, бухгалтерских, юридических и консультационных услуг, а также патентных и нотариальных услуг, услуг по таможенному оформлению, по проведению экспертиз и получению заключений, связанных с производственной деятельностью и эксплуатацией технического оборудования; ', '33')\n",
"('11', 'соответствовать следующим требованиям:', '18')\n",
"('26', 'порядок согласования новых условий соглашения о предоставлении гранта или расторжения соглашения о предоставлении гранта при недостижении согласия по новым условиям в случае уменьшения ранее доведенных до Министерства промышленности и торговли Российской Федерации лимитов бюджетных обязательств, приводящих к невозможности предоставления гранта в размере, определенном в соглашении о предоставлении гранта.', '2')\n",
"('1', '3. ', '24')\n",
"('24', '4. ', '10')\n",
"('10', '5. ', '23')\n",
"('23', '6. ', '24')\n",
"('24', '7. ', '19')\n",
"('19', '8. ', '26')\n",
"('26', '9. ', '19')\n",
"('19', '10. ', '38')\n",
"('38', '11. ', '35')\n",
"('35', '(п. 11 в ред. Правительства РФ от 21.04.2022 N 723) 12.', '10')\n",
"('10', '13. ', '26')\n",
"('26', '14. ', '37')\n",
"('37', '15. ', '35')\n",
"('35', '16. ', '19')\n",
"('19', '17. ', '26')\n",
"('26', '18. ', '20')\n",
"('20', '19. ', '16')\n",
"('16', '20. ', '20')\n",
"('20', '21. ', '35')\n",
"('35', '23. ', '24')\n",
"('24', '24. ', '35')\n",
"('35', '26. ', '22')\n",
"('22', '27. ', '19')\n",
"('19', '28. ', '38')\n",
"('38', '29. ', '3')\n",
"('3', '30. ', '38')\n",
"('38', '31. ', '37')\n",
"('37', '', '27')\n",
"('27', '35. ', '37')\n",
"('37', '37. ', '38')\n",
"('3', ' формирование и ведение которого осуществляется Министерством финансов Российской Федерации в установленном им порядке при формировании проекта федерального закона о федеральном бюджете (проекта федерального закона о внесении изменений в федеральный закон о федеральном бюджете). ', ' 3')\n",
"('38', 'Возврат указанной суммы денежных средств осуществляется в порядке, предусмотренном бюджетным законодательством Российской Федерации. ', '35')\n",
"('24', 'Федеральное агентство по туризму не позднее 10-го рабочего дня со дня принятия решения о заключении соглашения о предоставлении субсидии заключает с организацией указанное соглашение по форме, установленной Министерством финансов Российской Федерации. ', '36')\n",
"('30', ' оплата услуг по переводам документов, аудиторских, бухгалтерских, юридических и консультационных услуг, а также патентных и нотариальных услуг, услуг по таможенному оформлению, по проведению экспертиз и получению заключений, связанных с производственной деятельностью и эксплуатацией технического оборудования; ', '33')\n",
"('38', 'на основании требования Федерального агентства по делам молодежи - не позднее 10-го рабочего дня со дня получения получателем гранта указанного требования;', '37')\n",
"('22', 'предельный размер гранта; ', '24')\n",
"('38', 'III. Особенности предоставления субсидии в части поддержкипроектов, предусматривающих разработку стандартных образцов(введен Правительства РФ от 14.04.2022 N 653)27. ', '33')\n",
"('33', '28. ', '5')\n",
"('5', ' ', '24')\n",
"('24', 'б) ', '36')\n",
"('36', 'в) ', '27')\n",
"('27', 'г) ', '32')\n",
"('32', 'д) ', '24')\n",
"('24', 'е) ', '37')\n",
"('37', ';ж) ', '38')\n",
"('38', 'з) ', '31')\n",
"('31', 'и) ', '38')\n",
"('38', 'к) ', '24')\n",
"('24', 'л) ', '25')\n",
"('25', 'м) ', '24')\n",
"('24', 'н) ', '26')\n",
"('26', 'о) ', '24')\n",
"('24', '29. ', '22')\n",
"('22', '30. ', '30')\n",
"('30', '31. ', '19')\n",
"('19', '32. ', '20')\n",
"('20', '', '21')\n",
"('21', '', '14')\n",
"('14', '', '24')\n",
"('24', '34. ', '27')\n",
"('27', '35. ', '36')\n",
"('36', '37. ', '35')\n",
"('35', 'ж) ', '7')\n",
"('7', 'з) ', '35')\n",
"('35', '38. ', '8')\n",
"('8', '', '10')\n",
"('10', 'р) ', '17')\n",
"('17', '39. ', '11')\n",
"('11', '', '12')\n",
"('12', '40. ', '19')\n",
"('19', '41. ', '24')\n",
"('24', 'б) ', '22')\n",
"('22', 'г) ', '30')\n",
"('30', 'д) ', '24')\n",
"('24', 'е) ', '36')\n",
"('36', 'з) ', '24')\n",
"('24', 'и) ', '38')\n",
"('38', 'к) ', '31')\n",
"('31', 'л) ', '24')\n",
"('24', 'о) ', '27')\n",
"('27', ' ', '38')\n",
"('38', 'п) ', '24')\n",
"('24', 'р) ', '26')\n",
"('26', 'с) ', '24')\n",
"('24', 'у) ', '38')\n",
"('38', '42. ', '35')\n",
"('35', '43. ', '27')\n",
"('27', '44. ', '29')\n",
"('29', '', '28')\n",
"('28', '45. ', '37')\n",
"('37', '46. ', '38')\n",
"('20', 'Министерство науки и высшего образования Российской Федерации рассматривает документы, указанные в настоящих Правил, и в 20-дневный срок со дня их поступления принимает решение о заключении соглашения или об отказе в заключении соглашения, о чем уведомляет оператора в течение 5 рабочих дней со дня принятия решения', '19')\n",
"('19', '(пп. \"ж\" введен Правительства РФ от 30.12.2020 N 2373)7. ', '20')\n",
"('20', '', '21')\n",
"('21', '(в ред. Правительства РФ от 30.12.2020 N 2373)8. ', '27')\n",
"('27', '9. ', '29')\n",
"('29', ' ', '28')\n",
"('28', '(п. 9 в ред. Правительства РФ от 30.12.2020 N 2373)10. Утратил силу. - Правительства РФ от 30.12.2020 N 2373.11. ', '36')\n",
"('36', '12. ', '37')\n",
"('37', '13. ', '38')\n",
"('11', ' организация не является иностранным юридическим лицом, а также российским юридическим лицом, в уставном (складочном) капитале которого доля участия иностранных юридических лиц, местом регистрации которых является государство или территория, ', '24')\n",
"('24', 'включенные в утвержденный Министерством финансов Российской Федерации государств и территорий, предоставляющих льготный налоговый режим налогообложения и (или) не предусматривающих раскрытия и предоставления информации при проведении финансовых операций (офшорные зоны), в совокупности превышает 50 процентов; ', '11')\n",
"('11) за исключением случаев, если указанные иностранные юридические лица находятся под контролем российских юридических лиц или физических лиц (конечными бенефициарами являются Российская Федерация, российские юридические лица или физические лица), в том числе в случае, если этот контроль осуществляется через иные иностранные юридические лица; {11', 'з) ', '11')\n",
"('11', '9. ', '35')\n",
"('35', '11. ', '15')\n",
"('15', '12. ', '35')\n",
"('35', '15. ', '19')\n",
"('19', '', '11')\n",
"('11', '16. ', '19')\n",
"('19', '17. ', '20')\n",
"('20', '', '21')\n",
"('21', '19. ', '35')\n",
"('35', '', '22')\n",
"('22', '20. ', '35')\n",
"('35', '21. ', '24')\n",
"('24', '22. ', '26')\n",
"('26', 'д) ', '25')\n",
"('25', 'е) ', '26')\n",
"('26', '23. ', '35')\n",
"('35', '24. ', '6')\n",
"('6', '25. ', '22')\n",
"('22', '26. ', '19')\n",
"('19', '', '20')\n",
"('20', '27. ', '35')\n",
"('35', '28. ', '3')\n",
"('3', 'а) ', '20')\n",
"('20', 'б) ', '29')\n",
"('29', ' ', '28')\n",
"('28', '29. ', '21')\n",
"('21', '30. ', '35')\n",
"('35', '31. ', '36')\n",
"('36', '34. ', '27')\n",
"('27', '35. ', '35')\n",
"('35', '36. ', '37')\n",
"('37', '37. ', '38')\n",
"('25', ' Министерство экономического развития Российской Федерации:', '35')\n",
"('10', 'доменное имя, и (или) сетевой адрес, и (или) указатели страниц сайта в информационно-телекоммуникационной сети \"Интернет\", на котором обеспечивается проведение отбора; ', '24')\n",
"('15', ' обязательство Фонда о проведении отбора в соответствии с порядком, установленным настоящих Правил; ', '24')\n",
"('27', 'значения показателей, необходимых для достижения результата предоставления субсидии, указанные в настоящих Правил; ', '24')\n",
"('10', ' кредитная организация по состоянию на дату не ранее чем за 30 календарных дней до даты подачи заявки на получение субсидии не имеет просроченной задолженности по возврату в федеральный бюджет субсидий, бюджетных инвестиций, предоставленных из федерального бюджета в том числе в соответствии с иными правовыми актами, и иной просроченной (неурегулированной) задолженности по денежным обязательствам перед Российской Федерацией; ', '12')\n",
"('35', ' включения заемщика, содержащегося в реестре потенциальных заемщиков, в реестр заемщиков устанавливается ', '3')\n",
"('3', '', '35')\n",
"('22', ' Размер субсидии (S) по направлениям ее использования рассчитывается по формуле: ', '21')\n",
"('30', 'Расходы на оплату труда работников, на начисления на выплаты по оплате труда работников в соответствии с законодательством Российской Федерации, а также на иные указанные в настоящих Правил направления расходов не могут превышать 15 процентов размера субсидии.', '3')\n",
"('22', ' Si_март - размер субсидии i-му российскому аэропорту за март, рублей; ', '221')\n",
"('где:{22', ' Рмарт - размер расходной ставки аэропорта за март, равный 772 рублям на 1 \"потерянного\" пассажира, руб./пасс.; ', '22')\n",
"('22', ' Si_март - размер субсидии i-му российскому аэропорту за март, рублей; ', '221')\n",
"('где:{22', ' Рмарт - размер расходной ставки аэропорта за март, равный 772 рублям на 1 \"потерянного\" пассажира, руб./пасс.; ', '22')\n",
"('38', 'где: ', '22')\n",
"('22', '22. ', '38')\n",
"('36', ' сроки и формы представления отчета оператором о ходе реализации программ по развитию отдельных направлений Национальной технологической инициативы и отчета о расходах, источником финансового обеспечения которых является субсидия, а также отчета о достижении значения результата предоставления субсидии в соответствии с настоящих Правил;', '46')\n",
"('4', ' цели, условия и порядок предоставления и использования гранта;', '2')\n",
"('16', ' Отбор проводится образуемой Министерством промышленности и торговли Российской Федерации комиссией по проведению отбора (далее - комиссия). ', '316')\n",
"('12', ' выписка из Единого государственного реестра юридических лиц, заверенная в установленном порядке (в случае непредставления российской компанией такого документа Министерство промышленности и торговли Российской Федерации запрашивает его самостоятельно); ', '13')\n",
"('24', ' Основаниями для расторжения соглашения, в том числе расторжения соглашения Министерством промышленности и торговли Российской Федерации в одностороннем порядке, являются: ', '21')\n",
"('', '15указанных в настоящих Правил, полноту содержащихся в них сведений и направляет их на рассмотрение Комиссии. ', '15')\n",
"('15', ' заключает с производителями соглашения о предоставлении субсидии в течение 15 рабочих дней со дня окончания проверки, предусмотренной настоящего пункта. ', '35')\n",
"('35', 'уведомляет об этом производителя и возвращает заявление о включении в реестр получателей субсидии по договорам о реализации, заключенным в 2018 - 2019 годах, и документы, представленные производителем в соответствии с настоящих Правил; ', '15')\n",
"('7', 'Субсидии в целях осуществления мероприятий по приобретению объектов особо ценного движимого имущества в части транспортных средств. ', '2')\n",
"('35', 'отсутствие бюджетных ассигнований федерального бюджета, предусмотренных в целях предоставления субсидии.', '38')\n",
"('28', 'В случае если совокупный размер выплаты за период оплаты не превышает объем лимитов бюджетных обязательств, доведенных до ', '3')\n",
"('3', ' в соответствии с настоящих Правил, Федеральное агентство по туризму вправе установить очередной период оплаты.', '28')\n",
"('11', ' основные направления деятельности некоммерческой организации в соответствии с учредительными документами должны соответствовать тематике конкурса, в котором участвует некоммерческая организация; ', '25')\n",
"('26', ' Соглашение о предоставлении субсидии (дополнительное соглашение к соглашению о предоставлении субсидии, в том числе дополнительное соглашение о расторжении соглашения о предоставлении субсидии) с соблюдением требований о защите государственной тайны заключается', '24')\n",
"('38', 'В случае если требование, указанное в настоящих Правил, не выполнено в установленный срок, организация возвращает в федеральный бюджет полученные средства на основании: ', '36')\n",
"('21', 'Основаниями для отказа в предоставлении обществу субсидии являются: ', '23')\n",
"('27', 'Результатом предоставления субсидии является обеспечение страховой и гарантийной поддержки в отношении проектов, включенных в перечень. ', '28')\n",
"('11', 'соответствовать следующим требованиям:', '18')\n",
"('20', 'Перечисление субсидии получателю субсидии осуществляется на казначейский счет для осуществления и отражения операций с денежными средствами юридических лиц, не являющихся участниками бюджетного процесса, бюджетными и автономными учреждениями, открытый в территориальном органе Федерального казначейства, ', '29')\n",
"('37', 'Федеральное агентство воздушного транспорта осуществляет проверку соблюдения авиакомпанией условий и порядка предоставления субсидий, в том числе в части достижения результата предоставления субсидии, а органы государственного финансового контроля осуществляют проверки в соответствии со и Бюджетного кодекса Российской Федерации.', '7')\n"
]
}
],
"source": [
"#load data\n",
"\n",
"all_text, all_groups, doc_paths, doc_names = [],[],[],[]\n",
"for d in documents:\n",
" if 'ipynb' not in d:\n",
" text = get_text(d)\n",
" texts,groups = split_text(text)\n",
" all_text.extend(texts)\n",
" all_groups.extend(groups)\n",
" doc_paths.extend([d for a in range(len(texts))])\n",
" doc_names.extend([d.split('/')[-1] for a in range(len(texts))])"
]
},
{
"cell_type": "code",
"execution_count": 6,
"id": "1413bdb0-ed8d-453d-9b67-fde0cfacd4e5",
"metadata": {},
"outputs": [],
"source": [
"#load documents\n",
"#apply preprocessing to documents\n",
"\n",
"df = pd.DataFrame([doc_paths, doc_names,all_text, all_groups]).T\n",
"df.columns = ['path','doc','text','type']\n",
"df['r_text']='r'\n",
"df['r_text'] = df.text.apply(lowercase)\n",
"df['r_text'] = df.r_text.apply(clean_symb)\n",
"df['r_text'] = df.r_text.apply(lambda x:''.join([a for a in x if not a.isdigit()]))\n",
"df['r_text'] = df.r_text.apply(lambda x:' '.join([a for a in x.split(' ') if len(a)>1]))\n",
"df['r_text'] = df.r_text.apply(clean_stopwords)\n",
"df['text_size'] = df['text'].apply(lambda x: len(x.strip()))\n",
"df['is_text'] = df.r_text.apply(lambda x:x.strip().isdigit())\n",
"df = df[~df.is_text]\n",
"df = df[df['text_size']>5]\n",
"df = df.reset_index(drop=True)\n",
"df.shape\n",
"df.type = df.type.astype(int)-1"
]
},
{
"cell_type": "code",
"execution_count": 7,
"id": "1f4d8205-7f3f-430b-ac84-9e19ee913f81",
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"правил 3588\n",
"организации 2263\n",
"отбора 2042\n",
"соглашения 1940\n",
"предоставлении 1747\n",
"результата 1578\n",
"гранта 1556\n",
"министерством 1544\n",
"дня 1360\n",
"заявок 1344\n",
"dtype: int64"
]
},
"execution_count": 7,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"#show most popular words in datset\n",
"\n",
"all_words = np.hstack([np.array(a) for a in df.r_text.apply(lambda x:[a for a in x.split(' ') if len(a)>0]).values])\n",
"pd.Series(all_words).value_counts()[:10]"
]
},
{
"cell_type": "code",
"execution_count": 8,
"id": "4c22b4c2-9155-4655-bc95-6e3387b28ac4",
"metadata": {},
"outputs": [],
"source": [
"#split data to train/test\n",
"\n",
"from sklearn.utils import resample\n",
"from sklearn.model_selection import train_test_split\n",
"\n",
"X_data, X_val, y_data, y_val = train_test_split(list(df['r_text']), list(df['type']), test_size=0.1, random_state=42)"
]
},
{
"cell_type": "code",
"execution_count": 9,
"id": "eaac3775-7552-49c7-a891-c8ef5cccf6d9",
"metadata": {},
"outputs": [],
"source": [
"import numpy as np\n",
"import torch\n",
"from transformers import BertTokenizer, BertForSequenceClassification\n",
"from torch.utils.data import Dataset, DataLoader\n",
"from transformers import AdamW, get_linear_schedule_with_warmup\n",
"\n",
"from bert_dataset import CustomDataset"
]
},
{
"cell_type": "code",
"execution_count": 11,
"id": "c75236ca-e832-4748-a312-9cc7f7935f51",
"metadata": {},
"outputs": [],
"source": [
"#Bert Classifier class\n",
"\n",
"class BertClassifier:\n",
"\n",
" def __init__(self, model_path, tokenizer_path, n_classes=2, epochs=1, model_save_path='/content/bert.pt'):\n",
" self.model = BertForSequenceClassification.from_pretrained(model_path)\n",
" self.tokenizer = BertTokenizer.from_pretrained(tokenizer_path)\n",
" self.device = torch.device(\"cuda:0\" if torch.cuda.is_available() else \"cpu\")\n",
" self.model_save_path=model_save_path\n",
" self.max_len = 512\n",
" self.epochs = epochs\n",
" self.out_features = self.model.bert.encoder.layer[1].output.dense.out_features\n",
" self.model.classifier = torch.nn.Linear(self.out_features, n_classes)\n",
" self.model.to(self.device)\n",
" \n",
" def preparation(self, X_train, y_train, X_valid, y_valid):\n",
" # create datasets\n",
" self.train_set = CustomDataset(X_train, y_train, self.tokenizer)\n",
" self.valid_set = CustomDataset(X_valid, y_valid, self.tokenizer)\n",
"\n",
" # create data loaders\n",
" self.train_loader = DataLoader(self.train_set, batch_size=8, shuffle=True)\n",
" self.valid_loader = DataLoader(self.valid_set, batch_size=8, shuffle=True)\n",
"\n",
" # helpers initialization\n",
" self.optimizer = AdamW(self.model.parameters(), lr=2e-5, correct_bias=False)\n",
" self.scheduler = get_linear_schedule_with_warmup(\n",
" self.optimizer,\n",
" num_warmup_steps=0,\n",
" num_training_steps=len(self.train_loader) * self.epochs\n",
" )\n",
" self.loss_fn = torch.nn.CrossEntropyLoss().to(self.device)\n",
" \n",
" def fit(self):\n",
" self.model = self.model.train()\n",
" losses = []\n",
" correct_predictions = 0\n",
"\n",
" for data in tqdm(self.train_loader):\n",
" input_ids = data[\"input_ids\"].to(self.device)\n",
" attention_mask = data[\"attention_mask\"].to(self.device)\n",
" targets = data[\"targets\"].to(self.device)\n",
"\n",
" outputs = self.model(\n",
" input_ids=input_ids,\n",
" attention_mask=attention_mask\n",
" )\n",
"\n",
" preds = torch.argmax(outputs.logits, dim=1)\n",
" loss = self.loss_fn(outputs.logits, targets)\n",
"\n",
" correct_predictions += torch.sum(preds == targets)\n",
"\n",
" losses.append(loss.item())\n",
" \n",
" loss.backward()\n",
" torch.nn.utils.clip_grad_norm_(self.model.parameters(), max_norm=1.0)\n",
" self.optimizer.step()\n",
" self.scheduler.step()\n",
" self.optimizer.zero_grad()\n",
"\n",
" train_acc = correct_predictions.double() / len(self.train_set)\n",
" train_loss = np.mean(losses)\n",
" return train_acc, train_loss\n",
" \n",
" def eval(self):\n",
" self.model = self.model.eval()\n",
" losses = []\n",
" correct_predictions = 0\n",
"\n",
" with torch.no_grad():\n",
" for data in self.valid_loader:\n",
" input_ids = data[\"input_ids\"].to(self.device)\n",
" attention_mask = data[\"attention_mask\"].to(self.device)\n",
" targets = data[\"targets\"].to(self.device)\n",
"\n",
" outputs = self.model(\n",
" input_ids=input_ids,\n",
" attention_mask=attention_mask\n",
" )\n",
"\n",
" preds = torch.argmax(outputs.logits, dim=1)\n",
" loss = self.loss_fn(outputs.logits, targets)\n",
" correct_predictions += torch.sum(preds == targets)\n",
" losses.append(loss.item())\n",
" \n",
" val_acc = correct_predictions.double() / len(self.valid_set)\n",
" val_loss = np.mean(losses)\n",
" return val_acc, val_loss\n",
" \n",
" def train(self):\n",
" best_accuracy = 0\n",
" for epoch in range(self.epochs):\n",
" print(f'Epoch {epoch + 1}/{self.epochs}')\n",
" train_acc, train_loss = self.fit()\n",
" print(f'Train loss {train_loss} accuracy {train_acc}')\n",
"\n",
" val_acc, val_loss = self.eval()\n",
" print(f'Val loss {val_loss} accuracy {val_acc}')\n",
" print('-' * 10)\n",
"\n",
" if val_acc > best_accuracy:\n",
" torch.save(self.model, self.model_save_path)\n",
" best_accuracy = val_acc\n",
"\n",
" self.model = torch.load(self.model_save_path)\n",
" \n",
" def predict(self, text):\n",
" encoding = self.tokenizer.encode_plus(\n",
" text,\n",
" add_special_tokens=True,\n",
" max_length=self.max_len,\n",
" return_token_type_ids=False,\n",
" truncation=True,\n",
" padding='max_length',\n",
" return_attention_mask=True,\n",
" return_tensors='pt',\n",
" )\n",
" \n",
" out = {\n",
" 'text': text,\n",
" 'input_ids': encoding['input_ids'].flatten(),\n",
" 'attention_mask': encoding['attention_mask'].flatten()\n",
" }\n",
" \n",
" input_ids = out[\"input_ids\"].to(self.device)\n",
" attention_mask = out[\"attention_mask\"].to(self.device)\n",
" \n",
" outputs = self.model(\n",
" input_ids=input_ids.unsqueeze(0),\n",
" attention_mask=attention_mask.unsqueeze(0)\n",
" )\n",
" \n",
" prediction = torch.argmax(outputs.logits, dim=1).cpu().numpy()[0]\n",
"\n",
" return prediction"
]
},
{
"cell_type": "code",
"execution_count": 12,
"id": "38cf183b-a3ee-4ef2-94b9-051bcb8918c7",
"metadata": {},
"outputs": [
{
"name": "stderr",
"output_type": "stream",
"text": [
"Some weights of the model checkpoint at sberbank-ai/ruBert-base were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias', 'cls.predictions.decoder.weight', 'cls.predictions.decoder.bias', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias']\n",
"- This IS expected if you are initializing BertForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).\n",
"- This IS NOT expected if you are initializing BertForSequenceClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).\n",
"Some weights of BertForSequenceClassification were not initialized from the model checkpoint at sberbank-ai/ruBert-base and are newly initialized: ['classifier.weight', 'classifier.bias']\n",
"You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.\n"
]
}
],
"source": [
"#make bert\n",
"\n",
"classifier = BertClassifier(\n",
" model_path='sberbank-ai/ruBert-base',\n",
" tokenizer_path='sberbank-ai/ruBert-base',\n",
" n_classes=39,\n",
" epochs=10,\n",
" model_save_path='bert_fit_models/bert.pt'\n",
")"
]
},
{
"cell_type": "code",
"execution_count": 13,
"id": "2b3a3cb5-1dd5-42aa-9df7-903604ba28c4",
"metadata": {},
"outputs": [],
"source": [
"#prepare data to classification\n",
"classifier.preparation(\n",
" X_train=list(X_data),\n",
" y_train=list(y_data),\n",
" X_valid=list(X_val),\n",
" y_valid=list(y_val),\n",
" )"
]
},
{
"cell_type": "code",
"execution_count": 13,
"id": "54dacb80-c43f-47b1-83f9-490ad0d6d176",
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"Epoch 1/10\n"
]
},
{
"name": "stderr",
"output_type": "stream",
"text": [
"100%|███████████████████████████████████████| 1960/1960 [24:31<00:00, 1.33it/s]\n"
]
},
{
"name": "stdout",
"output_type": "stream",
"text": [
"Train loss 1.6872646148563648 accuracy 0.5666815485681486\n",
"Val loss 1.412977649804649 accuracy 0.6115892139988525\n",
"----------\n",
"Epoch 2/10\n"
]
},
{
"name": "stderr",
"output_type": "stream",
"text": [
"100%|███████████████████████████████████████| 1960/1960 [24:32<00:00, 1.33it/s]\n"
]
},
{
"name": "stdout",
"output_type": "stream",
"text": [
"Train loss 1.1436501777863928 accuracy 0.6886918808597488\n",
"Val loss 1.2984553687616225 accuracy 0.6374067699368904\n",
"----------\n",
"Epoch 3/10\n"
]
},
{
"name": "stderr",
"output_type": "stream",
"text": [
"100%|███████████████████████████████████████| 1960/1960 [24:32<00:00, 1.33it/s]\n"
]
},
{
"name": "stdout",
"output_type": "stream",
"text": [
"Train loss 0.9005808831667718 accuracy 0.7508131896166848\n",
"Val loss 1.2479785930946332 accuracy 0.6666666666666666\n",
"----------\n",
"Epoch 4/10\n"
]
},
{
"name": "stderr",
"output_type": "stream",
"text": [
"100%|███████████████████████████████████████| 1960/1960 [24:32<00:00, 1.33it/s]\n"
]
},
{
"name": "stdout",
"output_type": "stream",
"text": [
"Train loss 0.7234191348244037 accuracy 0.7962242489954717\n",
"Val loss 1.2792062138062004 accuracy 0.6580608146873207\n",
"----------\n",
"Epoch 5/10\n"
]
},
{
"name": "stderr",
"output_type": "stream",
"text": [
"100%|███████████████████████████████████████| 1960/1960 [24:30<00:00, 1.33it/s]\n"
]
},
{
"name": "stdout",
"output_type": "stream",
"text": [
"Train loss 0.5877058356572703 accuracy 0.8332164041074048\n",
"Val loss 1.3536883816464778 accuracy 0.6678141135972461\n",
"----------\n",
"Epoch 6/10\n"
]
},
{
"name": "stderr",
"output_type": "stream",
"text": [
"100%|███████████████████████████████████████| 1960/1960 [24:30<00:00, 1.33it/s]\n"
]
},
{
"name": "stdout",
"output_type": "stream",
"text": [
"Train loss 0.49206937486923547 accuracy 0.8616620957969259\n",
"Val loss 1.4424607625248236 accuracy 0.6752725186460126\n",
"----------\n",
"Epoch 7/10\n"
]
},
{
"name": "stderr",
"output_type": "stream",
"text": [
"100%|███████████████████████████████████████| 1960/1960 [24:25<00:00, 1.34it/s]\n"
]
},
{
"name": "stdout",
"output_type": "stream",
"text": [
"Train loss 0.40955075885392533 accuracy 0.8821353402640475\n",
"Val loss 1.5361568299250319 accuracy 0.6620768789443487\n",
"----------\n",
"Epoch 8/10\n"
]
},
{
"name": "stderr",
"output_type": "stream",
"text": [
"100%|███████████████████████████████████████| 1960/1960 [24:25<00:00, 1.34it/s]\n"
]
},
{
"name": "stdout",
"output_type": "stream",
"text": [
"Train loss 0.3543910782568024 accuracy 0.899292046686651\n",
"Val loss 1.6124461362428895 accuracy 0.6712564543889844\n",
"----------\n",
"Epoch 9/10\n"
]
},
{
"name": "stderr",
"output_type": "stream",
"text": [
" 58%|██████████████████████▌ | 1132/1960 [14:04<10:16, 1.34it/s]IOPub message rate exceeded.\n",
"The Jupyter server will temporarily stop sending output\n",
"to the client in order to avoid crashing it.\n",
"To change this limit, set the config variable\n",
"`--ServerApp.iopub_msg_rate_limit`.\n",
"\n",
"Current values:\n",
"ServerApp.iopub_msg_rate_limit=1000.0 (msgs/sec)\n",
"ServerApp.rate_limit_window=3.0 (secs)\n",
"\n"
]
}
],
"source": [
"#train\n",
"classifier.train()"
]
},
{
"cell_type": "code",
"execution_count": 20,
"id": "8dece2c7-b3be-4e69-b51b-a5a1b70bfaaf",
"metadata": {},
"outputs": [],
"source": [
"#save best model again\n",
"\n",
"torch.save(classifier.model,'bert_magnus_opum.pt')"
]
},
{
"cell_type": "code",
"execution_count": 10,
"id": "0e3977a9-ddeb-46e1-9b2a-46fc7b31ea1a",
"metadata": {
"tags": []
},
"outputs": [],
"source": [
"#load bert and truncate last layer\n",
"#get the embeddings layer\n",
"\n",
"model = torch.load('bert_opossum_best_0.6753.pt')\n",
"model = model.bert\n",
"model.to(device)\n",
"pass\n",
"\n",
"#load tokenizer\n",
"tokenizer = BertTokenizer.from_pretrained('sberbank-ai/ruBert-base')"
]
},
{
"cell_type": "code",
"execution_count": 11,
"id": "defe53ec-baa1-45f8-8d52-74ef2b425828",
"metadata": {},
"outputs": [],
"source": [
"#get token and embedding functions\n",
"\n",
"def get_token(text):\n",
" return tokenizer.encode_plus(\n",
" text,\n",
" add_special_tokens=True,\n",
" max_length=512,\n",
" return_token_type_ids=False,\n",
" truncation=True,\n",
" padding='max_length',\n",
" return_attention_mask=True,\n",
" return_tensors='pt')\n",
"\n",
"def get_embeddings(text):\n",
" encoding = get_token(text)\n",
" out = {\n",
" 'text': text,\n",
" 'input_ids': encoding['input_ids'].flatten(),\n",
" 'attention_mask': encoding['attention_mask'].flatten()\n",
" }\n",
"\n",
" input_ids = out[\"input_ids\"].to(device)\n",
" attention_mask = out[\"attention_mask\"].to(device)\n",
"\n",
" outputs = model(\n",
" input_ids=input_ids.unsqueeze(0),\n",
" attention_mask=attention_mask.unsqueeze(0)\n",
" )\n",
" return outputs[1].cpu().detach().numpy()[0]"
]
},
{
"cell_type": "code",
"execution_count": 12,
"id": "14627fdd-fa38-4cb8-b4c0-70a83f22c00e",
"metadata": {},
"outputs": [
{
"name": "stderr",
"output_type": "stream",
"text": [
"100%|█████████████████████████████████████| 17422/17422 [10:11<00:00, 28.48it/s]\n"
]
}
],
"source": [
"#get embeddings from text\n",
"\n",
"df['emb'] = df.r_text.progress_apply(get_embeddings)"
]
},
{
"cell_type": "code",
"execution_count": 45,
"id": "b23c2f54-9533-4fac-a28f-db02f97d4ce6",
"metadata": {},
"outputs": [],
"source": [
"#split data again\n",
"\n",
"X_full = np.asarray([a for a in df['emb'].values])\n",
"y_full = df['type'].values.astype(int)\n",
"\n",
"X_data, X_val, y_data, y_val = train_test_split(X_full, y_full, test_size=0.1, random_state=42)"
]
},
{
"cell_type": "code",
"execution_count": 46,
"id": "142b7f1a-4701-48a0-a801-f275efe683a4",
"metadata": {},
"outputs": [],
"source": [
"## check upsampling data\n",
"## permutation data\n",
"\n",
"\n",
"np.random.seed(77112)\n",
"\n",
"class_size=833\n",
"X_data_r, y_data_r = [],[]\n",
"\n",
"\n",
"for d in np.unique(y_data):\n",
" X_data_r.append(resample(X_data[y_data==d],\n",
" replace=True,\n",
" n_samples=833,\n",
" random_state=42))\n",
" y_data_r.append(np.full([class_size],d))\n",
"\n",
"X_data, y_data = np.vstack(X_data_r), np.hstack(y_data_r)\n",
"\n",
"permutations = np.random.permutation(len(X_data))\n",
"\n",
"X_data, y_data = X_data[permutations], y_data[permutations]"
]
},
{
"cell_type": "code",
"execution_count": 47,
"id": "dc89ab58-527d-4691-8ae0-37281426f3e9",
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"(32487, 768)"
]
},
"execution_count": 47,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"X_data.shape"
]
},
{
"cell_type": "code",
"execution_count": 48,
"id": "565440c4-0f36-4b20-804b-74ea26e03fdc",
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"0.03843947217441193\n"
]
},
{
"data": {
"text/plain": [
"<AxesSubplot:xlabel='real'>"
]
},
"execution_count": 48,
"metadata": {},
"output_type": "execute_result"
},
{
"data": {
"image/png": "iVBORw0KGgoAAAANSUhEUgAAAjIAAAHBCAYAAABzIlFzAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjUuMywgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy/NK7nSAAAACXBIWXMAAA9hAAAPYQGoP6dpAABhEUlEQVR4nO3deXhMZ/sH8O9MIsSSxL4k9lYskUUlaGILYhdaeXWhaGhaaq23dKG0iqpSpQhSrdIFbb2tfadUayliF7WlhGyyNYkkM/fvD785NbLNDJPMSb6f6+pVOfPc89zPec5M7pw55xmNiAiIiIiIVEhb3AkQERERWYqFDBEREakWCxkiIiJSLRYyREREpFosZIiIiEi1WMgQERGRarGQISIiItViIUNERESqZV/cCTxuIgK9Pvcaf1qtJs/tBbHVGOZVesdiq3lZEmOreVkSw7xK71hsNS9LYoozL61WA41GY9bzGJS4QkavFyQm/mO0zd5ei8qVKyAlJR05OXqTnsdWY5hX6R2LreZlSYyt5mVJDPMqvWOx1bwsiSnuvKpUqQA7O8sKGX60RERERKrFQoaIiIhUi4UMERERqRYLGSIiIlItFjJERESkWiXuriUiIiJz6fV6ZGXlIDPTDllZ96DTFX5LsV6vMau9LcdYsw87O3totdY7b8JChoiISi0RQUpKIjIy0gAA8fFa6PWm3UpsSXtbjrFmH46OFeHkVMWs5zaV2YXM9evXERERgVOnTiEqKgqNGjXCpk2blMf//vtvdOnSJc9YBwcHnD59usB2Xl5eWLdunblpERERmc1QxFSsWBkODmVhb681+YwEANjZacxqb8sx1uhDRJCVdQ9paXcBAFWrVjfr+U1hdiETFRWF/fv3w8vLC3q9HiLGA6hRowa+//57o20ighEjRqBt27a5nm/ixIlo06aN8nOFChXMTYmIiMhser1OKWIqVnQCcH/BNlMXd7OkvS3HWKsPB4eyAIC0tLvQ6x//WRmzC5nAwEB07doVADBlyhScOXPG6HEHBwd4e3sbbfvjjz+QlpaGPn365Hq++vXr52pPRERkbTqdDsC/v2jJegz7OCdH99if2+yrbyy5YGfTpk2oWLEiAgMDzY4lIiKyJku/44dM9+8+Nu+jK1NY/WLf7Oxs7NixA926dUPZsrmr3unTp2PChAlwcXFBly5dMGnSJLi4uDxSn/b2xsWWnZ3W6P+msNUY5lV6x2KreVkSY6t5WRLDvNQ7Fr3euIAx/K7VaAAx4fetue1tOaao8rJkLgtj9ULmwIEDSEpKyvWxkoODA55//nkEBATAyckJp06dwrJly3DmzBmsX78eZcqUsag/rVaDypXzvs7GycnR7Oez1RjmVXrHYqt5WRJjq3lZEsO81DeWzEw7xMdrYWenMfoD2M5OC41GA63WtDM1lvxSLrjAklzXn1qjn8fR3tQYvV4DrVaLihXLAbBsLvNj9ULml19+QbVq1dCuXTuj7TVq1MD06dOVn/38/PDkk08iLCwMO3fuRK9evSzqT68XpKSkG22zs9PCyckRKSkZ0OlMu5DJVmOYV+kdi63mZUmMreZlSQzzUu9YsrLuQa/XQ6cT5OToodHcjxMROLk4wk5TPGvG6kSPpMR06PX3ixlDXjqdPt8zHwcO7EN8fByeeSbE5JgHmdve3BidTqDX65GWloly5crlmhcnJ0eLz9JYtZD5559/sHfvXoSEhMDOzq7Q9h07dkT58uVx9uxZiwsZAPleQa3T6c2+IttWY5hX6R2LreZlSYyt5mVJDPNS31gevm3Y8MtYo9HATqNFBPYgBnfN6u9R1UZlhGoCodVqlELGkFdBxcKvv+7DhQvnlELGlJgHmdve0hhD8WLJXObHqoXMzp07kZmZib59+1qzGyIiVdBq739c8fB1Anq9KL+0yHbE4C6ikVDcaTw2IoLs7Gw4ODgUdyqPlVULmU2bNqFevXrw8vIyqf3evXuRnp6Oli1bWjMtIqIip9VqUMXFEZoHzk4brhMQnQ6JSRksZsgiH344HVu33l+YNiCgNQCgZ88+0Gg0OH/+LEaNGotlyz7H9etX8d57M5GRkYFZs2Zg06ZdRjfXDBnyHJ54ogneeWe6su3MmUgsX74E586dgZ2dHdq1C8C4cW+gcmXrrNJrCbMLmYyMDOzfvx8AcPPmTaSlpWHbtm0A7l/nUqXK/cElJibi8OHDGDlyZJ7PM2fOHGg0Gnh7e8PJyQmRkZEIDw+Hh4eHsk4NEVFJodVq7hcxERFATMy/D9SuDU1oqNFHCUTmGDZsBJKS7uL69WuYNm0mAKBy5cr46qsIxMfH49NP52Ho0FDUrFkLNWvWQmTkSZOe98yZSIwZE4a2bf0xY8ZsZGZmYMWKpZgy5Q2Eh6+y4ojMY3Yhk5CQgHHjxhltM/y8evVqZZXerVu3IicnJ9+PlRo3boxvv/0W69atQ2ZmJmrWrImBAwdi7NixsLfnV0ARUQkVEwNERxd3FlSCuLq6wcWlMm7fjoGHh/EnGqmpKZg37zO0aOGhbDO1kFm2bDGaNm2GWbM+VtaBadToCbz00iAcPnwQ7doFPLYxPAqzKwY3NzdcvHix0HYvvvgiXnzxxXwfDwkJQUhIiLndExERkYmcnZ2NihhTZWZm4vTpUxg9epyyAjIA1K1bDzVq1MT58+fUW8gQERGROlSuXNWiuNTUFOh0Onz22Xx89tn8XI/Hxt551NQeGxYyREREJVRe375guGspJyfbaHtqaory74oVK0Gj0WDIkOHo0KFTrudwdnZ5nGk+EhYyREREKmdvXwZZWVkmta1evSYA4Nq1q6hWrbry7zt3/j3L4ujoCA+Plrh+/SqaNh31+BN+jFjIEBER5aE2KqumzwYNGmDLlp+xc+c21K1br8AzJi1aeKBGjZpYtGg+wsJexz//pGHNmq/g7Oxs1G7UqHEYN+41TJv2Frp0CUKlSpUQFxeLo0f/QK9efdGqVWuLcn3cWMgQERE9QK8X6ESPUE1gsfSvE73Zt+L36ROMc+fO4tNPP0ZycrKyjkxe7O3tMWvWPHzyyWxMnToZbm51MWbMRHz++adG7Vq29MKSJSsRERGO2bNnIDs7G9Wr10Tr1r5wc6tr6fAeOxYyRERED9DrBUmJ6SZ9aaThu4bMUViMJSs9V6hQETNmzDLaZm+vzfdrAJo2bYYVK1Ybbfv66+9ytW/atDk+/nihWbkUNRYyREREDzGnmLDkO4Me1/cMEVA8X+1JRERE9BiwkCEiIiLVYiFDREREqsVChoiIiFSLhQwRERGpFgsZIiIiUi0WMkRERKRaLGSIiIhItbggHhER0UO0Wo3JK/uaq7AYS1b2BYDvv1+L77//BvHxcfD3b4+PP15QaMzAgX3x9NMBmDhxstn92QoWMkRERA/QajWo4uIIjZ1dsfQvOh0SkzLMKmaio29g8eJP8eKLQ+Hv377AL40saVjIEBERPUCr1dwvYiIigJiYou28dm1oQkOh1WrMKmRu3LgOEUHfvv3h6upmxQRtDwsZIiKivMTEANHRxZ1FoT78cDq2bt0EABg0qD8AYMKENxEdfQ1//PE7YmPvoHLlKmjTph1ee20sKlasmO9zXbnyF5YsWYhz587i3r1M1KhRE336BOPFF4cqbc6cicTy5Utw7twZ2NnZo107f4wb9wYqV65i1XHmh4UMERGRig0bNgINGjTE0qWL8OGHH6Nq1WpwdXXDF1+E45VXRsHFpTJiY+9g9eov8NZbb2DRovB8n2vy5ImoUqUKpkyZiooVK+Lvv6MRFxerPH7mTCTGjAlD27b+mDFjNrKyMhEevgRTpryB8PBVRTHcXFjIEBERqZirqxvq1q0PAGjSxB21a9cBAEye/LbyLds5OTmoXbsORo0agRs3rqNevfq5nicp6S5iYm5i3Lg3EBDQAQDQqlVrozbLli1G06bNMGvWx9BoNLC316JBg8Z46aVBOHz4INq1C7DmUPPEQoaIiKgE2rp1E775Zg3+/jsaGRkZyvbo6Bt5FjLOzi6oVas2wsMXIzU1BU895YsaNWoqj2dmZuL06VMYPXocdDrd/2/Vom7deqhRoybOnz/HQoaIiIge3f79ezFjxjT06zcAr7wyCk5OLkhIiMfbb09CVta9PGM0Gg3mz1+M5cuXYP78j5CRkQF392YYM2YCvL1bITU1BTqdDp99Nh+ffTY/V3xs7B1rDytPLGSIiIhKmL17d6FJE3e8+eY7yrYTJ44XGlevXn3MnPkRcnJycPr0KSxf/jkmT56An37aiooVK0Gj0WDIkOHo0KETgPtr4uh09z++Kq5bvlnIEBERlTD37t2DvX0Zo207dmwzOd7e3h4+Pk/hxReHYcqUiYiPj0O9evXh4dES169fRdOmo/6/nVa5Dqe4sJAhIiIqYXx922D+/I/w5Zcr0aJFS/z++yEcP36kwJioqEtYuHA+unQJgqurG9LS0vD116tQu3YdZW2aUaPGYdy41zBt2lvo0iUILi7OuH37No4e/QO9evXNdXFwUWAhQ0RElJfatVXbZ3DwM7h9+xY2bPge33zzNfz82uK99z5EWNiwfGOqVq2GqlWr4uuvVyE+Pg4VKlSEl5c3pk37AHb/v8pxy5ZeWLJkJSIiwjF79gxkZ+egevUaaN3aF25udR9L7uZiIUNERPQAvV4gOh00oaHF0r/odGZ/11KHDp1w8OAx5Wc7OzuMHTsBo0aNM2r3YBsA2LDhF+XfVapUwdSpHxTaV9OmzfHxxwsB8KMlIiIim6PXCxKTMkz+0kjDxa6mKizG0i+NLK1YyBARET3EnGLCkjMSxX0WoyQx//vHiYiIiGwECxkiIiJSLRYyREREpFosZIiIqFQT4YW11vbvPi78AmpzsZAhIqJSybA2Sn7fPUSPj2Ef29vbPfbn5l1LRERUKmm1dnB0rIi0tLsAAAeHstDrtdDpTD9Do9drzGpvyzHW6ENEkJV1D2lpd+HoWBFaLQsZIiKix8bJqQoAKMWMVquFXm/6rdHmtrflGGv24ehYUdnXj5vZhcz169cRERGBU6dOISoqCo0aNcKmTZuM2gwZMgRHjuT+ToctW7agcePGys+pqamYPXs2du3ahezsbLRv3x7vvvsuatSoYcFQiIiIzKPRaODsXBWVKlUGoIezsyOSk9NNOjNhZ6eBs3N5k9vbcow1+7Czs4dWa70rWcwuZKKiorB//354eXlBr9fne5FUq1atMHnyZKNtbm5uRj+PHz8ely9fxvTp01G2bFl8+umnGDlyJH744QfY2/NkERERFQ2tVgt7e3uUK1cOGRk6kxass7fXmtXelmOKKi9rMLtaCAwMRNeuXQEAU6ZMwZkzZ/Js5+TkBG9v73yf58SJEzh48CAiIiIQEBAAAGjYsCF69eqFHTt2oFevXuamRkRERKWM2ed6HtfpoQMHDsDJyQn+/v7KtkaNGqFZs2Y4cODAY+mDiIiISjarfWh15MgReHt7o2XLlhg8eDCOHj1q9PiVK1fQsGFDaDTG95Q3atQIV65csVZaREREVIJY5UIUX19fBAcHo0GDBoiNjUVERASGDx+Or7/+Gj4+PgCAlJQUVKpUKVess7Nzvh9Xmcre3rg+s7PTGv3fFLYaw7xK71hsNS9LYmw1L0tiTG3/uB7nPmZe1oix1bxMYZVCZuzYsUY/d+rUCX369MGSJUuwYsUKa3Sp0Go1qFy5Qp6POTk5mv18thrDvErvWGw1L0tibDUvS2Is6cOSeO5j6/ZhSYyt5mVJjK3mVZAiuTWofPny6NixI7Zv365sc3Jywu3bt3O1TU5OhrOzs8V96fWClJR0o212dlo4OTkiJSUDOp1pV1bbagzzKr1jsdW8LImx1bwsiTG1vaFdfkyN5z5mXtaIKe68nJwcLT5LU2z3ODdq1AiHDx+GiBhdJ3P16lU0adLkkZ47v9vAdDq92beI2WoM8yq9Y7HVvCyJsdW8LImxpA9L4rmPmZc1Y2w1r4IUyXctpaenY9++fWjZsqWyrUOHDkhOTsbhw4eVbVevXsW5c+fQoUOHokiLiIiIVM7sMzIZGRnYv38/AODmzZtIS0vDtm3bAAB+fn64cuUKVq5ciW7dusHV1RWxsbFYtWoV4uLisHDhQuV5fHx8EBAQgLfffhuTJ09G2bJlsWDBAri7uyMoKOgxDY+IiIhKMrMLmYSEBIwbN85om+Hn1atXo1atWsjOzsaCBQuQlJQER0dH+Pj4YMaMGfD09DSK+/TTTzF79mxMmzYNOTk5CAgIwLvvvstVfYmIiMgkZlcMbm5uuHjxYoFtIiIiTHquSpUqYdasWZg1a5a5aRAREREVzTUyRERERNbAQoaIiIhUi4UMERERqRYLGSIiIlItFjJERESkWixkiIiISLVYyBAREZFqsZAhIiIi1WIhQ0RERKrFQoaIiIhUi4UMERERqRYLGSIiIlItFjJERESkWixkiIiISLVYyBAREZFqsZAhIiIi1WIhQ0RERKrFQoaIiIhUi4UMERERqRYLGSIiIlItFjJERESkWixkiIiISLVYyBAREZFqsZAhIiIi1WIhQ0RERKrFQoaIiIhUi4UMERERqRYLGSIiIlItFjJERESkWixkiIiISLVYyBAREZFqsZAhIiIi1WIhQ0RERKrFQoaIiIhUy764EyCyBq1WA61WAwCws9Ma/V+vF+j1Umy5ERHR48NChkocrVaDKi6O0NjZGW13cnIEAIhOh8SkDBYzREQlAAsZKnG0Ws39IiYiAoiJMX6wdm1oQkOh1WpYyBARlQAsZKjkiokBoqOLOwsiIrIiswuZ69evIyIiAqdOnUJUVBQaNWqETZs2KY+npaVh1apV2L9/P65duwYHBwd4enpiwoQJcHd3V9r9/fff6NKlS67n9/Lywrp16ywcDhEREZUmZhcyUVFR2L9/P7y8vKDX6yFifHr+1q1b+P777/Hss89i/PjxuHfvHr744gsMGjQIP/zwAxo3bmzUfuLEiWjTpo3yc4UKFSwcChEREZU2ZhcygYGB6Nq1KwBgypQpOHPmjNHjbm5u2LlzJxwdHZVtbdu2RWBgIL755htMnTrVqH39+vXh7e1tQepERERU2pldyGi1BS89U758+VzbKlSogHr16iE2Ntbc7oiIiIjyVSQX+6akpCAqKgpPP/10rsemT5+OCRMmwMXFBV26dMGkSZPg4uLySP3Z2xsXWw+vI2IKW41hXoXHmPJ8psTbwljUkJclMbaalyUxprZ/XI9zHzMva8TYal6mKJJC5uOPP4ZGo8Hzzz+vbHNwcMDzzz+PgIAAODk54dSpU1i2bBnOnDmD9evXo0yZMhb1pdVqULly3tfZGNYRMYetxjAv82PMjbfVsdhqXpbE2GpelsQUxTFpST+2ur8siWFepXss+bF6IfPDDz9g3bp1mDNnDmrVqqVsr1GjBqZPn6787OfnhyeffBJhYWHYuXMnevXqZVF/er0gJSXdaJudnRZOTo5IScmATqc36XlsNYZ5FR5jaFMQU+JtYSxqyMuSGFvNy5IYU9sXdlyaGs99zLysEVPceTk5OVp8lsaqhcz+/fsxbdo0jBo1CgMGDCi0fceOHVG+fHmcPXvW4kIGAHJy8t6hOp0+38fyY6sxzMv8GHPjbXUstpqXJTG2mpclMUVxTBZVXrYaw7xK91jyY7UvjTx58iTGjRuH/v37Y9y4cdbqhoiIiEoxqxQyly9fRlhYGNq2bYsZM2aYHLd3716kp6ejZcuW1kiLiIiIShizP1rKyMjA/v37AQA3b95EWloatm3bBuD+dS4igtDQUJQtWxZDhw41WmemYsWKeOKJJwAAc+bMgUajgbe3N5ycnBAZGYnw8HB4eHgo69QQERERFcTsQiYhISHXR0WGn1evXg0AuH37NgBg2LBhRu38/Pzw9ddfAwAaN26Mb7/9FuvWrUNmZiZq1qyJgQMHYuzYsbC351dAERERUeHMrhjc3Nxw8eLFAtsU9jgAhISEICQkxNzuiYiIiBRWu9iXiIiIyNpYyBAREZFqsZAhIiIi1WIhQ0RERKrFQoaIiIhUi4UMERERqRYLGSIiIlItFjJERESkWixkiIiISLVYyBAREZFqsZAhIiIi1WIhQ0RERKrFr5kmVdBqNdBqNbCzu197G/6v1wv0einO1IiIqBixkCGbp9VqUMXFERo7O2Wbk5MjAEB0OiQmZbCYISIqpVjIkM3TajX3i5iICCAm5t8HateGJjQUWq2GhQwRUSnFQobUIyYGiI4u7iyIiMiG8GJfIiIiUi0WMkRERKRaLGSIiIhItVjIEBERkWqxkCEiIiLVYiFDREREqsXbr4mIiGwQVzQ3DQsZIiIiG8MVzU3HQoaIqJTjX/62hyuam46FDBFRKca//G0cVzQvFAsZIqJSjH/5k9qxkCEiIv7lT6rFQoaIiIhMZmvXVLGQISIiIpPY4jVVLGSIiIjIJLZ4TRULGSIiIjKPDV1Txa8oICIiItViIUNERESqxUKGiIiIVIuFDBEREakWCxkiIiJSLRYyREREpFpmFzLXr1/HtGnTEBwcjObNm6NPnz55tlu/fj26d++Oli1bol+/fti7d2+uNqmpqXj77bfh5+cHHx8fjB07FrGxseaPgohUQavVwN5ea7QiqL39/f+0Wk0xZ0dEamR2IRMVFYX9+/ejfv36aNy4cZ5tNm/ejKlTp6Jnz55YsWIFvL298frrr+PkyZNG7caPH49Dhw5h+vTpmDdvHq5evYqRI0ciJyfHosEQke0yrAhauXIFZSVQJ6f7P1euXAFVXBxZzBCR2cxeEC8wMBBdu3YFAEyZMgVnzpzJ1eazzz5D7969MX78eABA27ZtcenSJXz++edYsWIFAODEiRM4ePAgIiIiEBAQAABo2LAhevXqhR07dqBXr16WjomIbFC+K4IC/KZlIrKY2WdktNqCQ6Kjo3Ht2jX07NnTaHuvXr1w+PBhZGVlAQAOHDgAJycn+Pv7K20aNWqEZs2a4cCBA+amRURqYVgR9MH/Hi5siIhM9Ni/ouDKlSsA7p9deVDjxo2RnZ2N6OhoNG7cGFeuXEHDhg2h0RifSm7UqJHyHJaytzcuth7+hk5T2GpMaczL3MdNyaGgNqVxHxdFTGmfl8f1uNrzsiRG7XNvSQyPF9M99kImOTkZAODk5GS03fCz4fGUlBRUqlQpV7yzs3OeH1eZSqvVoHLlCnk+Zvhc3hy2GlPa8yqKPkv7PrbVubTVsRTVcVxS8rIkpiTNva3Oi63mVZAS96WRer0gJSXdaJudnRZOTo5IScmATqc36XlsNaY05mVol5+H4wtrn1eMJXkVdYyt5mVqTGmfF3OP45KalyUxap97S2JK2/Hi5ORo8Vmax17IODs7A7h/a3X16tWV7SkpKUaPOzk54fbt27nik5OTlTaWysnJeyfqdPp8H8uPrcaU9ryKos/Svo9tdS5tdSxFdRyXlLwsiSlJc2+r82KreRXksS+I16hRIwDIdZ3LlStXUKZMGdStW1dpd/XqVYgY36Fw9epV5TmIiIiICvLYC5m6deuiQYMG2LZtm9H2LVu2oF27dnBwcAAAdOjQAcnJyTh8+LDS5urVqzh37hw6dOjwuNMiIiKiEsjsj5YyMjKwf/9+AMDNmzeRlpamFC1+fn6oUqUKxowZg0mTJqFevXpo06YNtmzZgsjISKxZs0Z5Hh8fHwQEBODtt9/G5MmTUbZsWSxYsADu7u4ICgp6TMMjIiqcVqtRFuN7+K4KvV64tg2RDTO7kElISMC4ceOMthl+Xr16Ndq0aYM+ffogIyMDK1aswPLly9GwYUMsXrwYPj4+RnGffvopZs+ejWnTpiEnJwcBAQF49913YW9f4q5BJiIbZVhxWGNnZ7TdcEGj6HRITMpgMUNko8yuGNzc3HDx4sVC24WEhCAkJKTANpUqVcKsWbMwa9Ysc9MgInosuOIwkbrx1AcREfDvisNEpCqP/WJfIiIioqLCQoaIiIhUi4UMERERqRYLGSIiIlItFjJERESkWixkiIiISLVYyBAREZFqsZAhIiIi1WIhQ0RERKrFQoaIiIhUi4UMERERqRYLGSIiIlItFjJERESkWixkiIiISLVYyBAREZFqsZAhIiIi1WIhQ0RERKrFQoaIiIhUi4UMERERqRYLGSIiIlItFjJERESkWixkiIiISLVYyBAREZFqsZAhIiIi1WIhQ0RERKrFQoaIiIhUi4UMERERqRYLGSIiIlItFjJERESkWixkiIiISLVYyBAREZFqsZAhIiIi1WIhQ0RERKrFQoaIiIhUi4UMERERqRYLGSIiIlItFjJERESkWvbWeNIhQ4bgyJEjeT42f/589O7dO982W7ZsQePGja2RFpEqabUaaLUa2Nnd/7vD8H8A0OsFer0UV2pERMXOKoXMe++9h7S0NKNtX331FXbs2IF27dop21q1aoXJkycbtXNzc7NGSkSqpNVqUMXFERo7O2Wbk5Oj8m/R6ZCYlMFihohKLasUMk888USubW+88Qb8/f1RpUoVZZuTkxO8vb2tkQJRiaDVau4XMRERQEyM8YO1a0MTGgqtVsNChohKLasUMg/7888/8ffff2P8+PFF0R1RyRMTA0RHF3cWREQ2p0gKmU2bNqF8+fLo0qWL0fYjR47A29sbOp0OXl5eGDduHHx9fR+5P3t742uY87q2oDC2GlMa8zL3cVNyKKiNLe1jjqXk5PW4Hn/cr8mizsuSGFs6jouqDx4vprN6IZOTk4OtW7ciMDAQ5cuXV7b7+voiODgYDRo0QGxsLCIiIjB8+HB8/fXX8PHxsbg/rVaDypUr5PnYg9cWmMpWY0p7XkXRp63uY0viORbbzMuS+KJ4TVoSX5LeX2w1L0viS9Lxkh+rFzKHDh1CYmIi+vTpY7R97NixRj936tQJffr0wZIlS7BixQqL+9PrBSkp6Ubb7Oy0cHJyREpKBnQ6vUnPY6sxpTEvQ7v8PBxfWPu8YizJqyhiOJaSk5e5x7Gl/dh6XpbE2NJxXFR9lLbjxcnJ0eKzNFYvZDZt2gQXFxcEBAQU2K58+fLo2LEjtm/f/sh95uTkvRN1On2+j+XHVmNKe15F0aet7mNL4jkW28zLkviieE0WRV6WxNjqcWyrx6Ql/dhqXgWx6oJ4mZmZ2LVrF3r06IEyZcpYsysiIiIqhaxayOzZswfp6eno27dvoW3T09Oxb98+tGzZ0popERERUQli1Y+WfvnlF9SpUwdPPfWU0fZjx45h5cqV6NatG1xdXREbG4tVq1YhLi4OCxcufGz9c0VUIiKiks1qhUxycjJ+/fVXDB06FBqNxuix6tWrIzs7GwsWLEBSUhIcHR3h4+ODGTNmwNPT87H0zxVRiYiISj6rFTLOzs44c+ZMno/Vr18fERER1uoaAFdEJSIiKg2KZEG8YsUVUYmIiEosq17sS0RERGRNLGSIiIhItVjIEBERkWqxkCEiIiLVYiFDREREqsVChoiIiFSLhQwRERGpFgsZIiIiUi0WMkRERKRaLGSIiIhItVjIEBERkWqV/O9aql3btG1ERESkOiW6kBG9HprQ0HwfIyIiInUr0YWMRqvFRhxBPFKNtldDJfTX+uUZo9VqoNVqYGd3/1M3w//1eoFeL9ZNmIiIiMxSogsZADiDaEQjwWhbXVRFf+QuZLRaDaq4OEJjZ6dsc3JyBACITofEpAwWM0RERDakxBcy5tBqNfeLmIgIICbm3wdq14YmNBRarYaFDBERkQ1hIZOXmBggOrq4syAiIqJCsJAhohKH17oRlR4sZIioROG1bkSlCwsZIipReK0bUenCQoaISiZe60ZUKvArCoiIiEi1WMgQERGRarGQISIiItViIUNERESqxUKGiIiIVIuFDBEREakWb78mIiKbxBWayRQsZIiIyOZwhWYyFQsZIiKyOVyhmUzFQoaIiGwXV2imQvBiXyIiIlItFjJERESkWixkiIiISLVYyBAREZFqsZAhIiIi1WIhQ0RERKpllULmxx9/hLu7e67/5s2bZ9Ru/fr16N69O1q2bIl+/fph79691kiHyCRarQb29lqjVUTt7e//p9Vqijk7IqKCGd7D8nofK8nvYVZdR2blypWoVKmS8nPNmjWVf2/evBlTp07Fq6++irZt22LLli14/fXXsXbtWnh7e1szLaJcClpFFOBKokRk2/J6DwNKx2rIVi1kWrRogSpVquT52GeffYbevXtj/PjxAIC2bdvi0qVL+Pzzz7FixQprpkWUS76riAJcSZSIbF5pfg8rlpV9o6Ojce3aNfz3v/812t6rVy/MnTsXWVlZcHBwKI7UqLTjKqJEpGal8D3MqoVMnz59cPfuXdSpUwf/+c9/MGLECNjZ2eHKlSsAgIYNGxq1b9y4MbKzsxEdHY3GjRtb3O+Dnw8W5OE2hcWY+rgpfVsaUxR92Fpe5j5ujbkvrI21xm+reVkSU1RjKYrjpSjysrQfW8/L1Bhbzauo+uBxbDqrFDLVq1fHmDFj4OXlBY1Ggz179uDTTz/FnTt3MG3aNCQnJwMAnJycjOIMPxset4RWq0HlyhVMavvgNRCPs725z2vNXIo6pqjyKo4+TYmx1fHb0j561HhbPV6KKq+ieE1aEl/Ux4st5WWrrxVLYmz5eMmPVQqZ9u3bo3379srPAQEBKFu2LL766iu8+uqr1uhSodcLUlLSYWenLXRHpaRkQKfTKz8XFvNw+4cZ4gtr9ygxRdGHreVl7rxYY+7ziskrx8c9flvNy5KYohpLURwvRZGXpf3Yel6mxthqXkXVR2k7jp2cHC0+S1Nk18j07NkTX3zxBc6fPw9nZ2cAQGpqKqpXr660SUlJAQDlcUvl5Jh2QOl0epPbmtPe3Oe1Zi4lNa/i6NOUGFsdvy3to0eNt9XjpajyKorXZFHkZWmMLeZlq68VS2Js+XjJT7EsiNeoUSMAUK6VMbhy5QrKlCmDunXrFkdaREREpDJFVshs2bIFdnZ2aN68OerWrYsGDRpg27Ztudq0a9eOdywRERGRSazy0VJoaCjatGkDd3d3AMDu3buxbt06vPTSS8pHSWPGjMGkSZNQr149tGnTBlu2bEFkZCTWrFljjZSIiIioBLJKIdOwYUP88MMPuH37NvR6PRo0aIC3334bQ4YMUdr06dMHGRkZWLFiBZYvX46GDRti8eLF8PHxsUZKREREVAJZpZB59913TWoXEhKCkJAQa6RAREREpQC//ZqIiIhUi4UMERERqRYLGSIiIlKtYvnSSCKyPVqtBlqtJtd3oej1UiK/MZeISgYWMkQErVaDKi6O0NjZKdsMy5CLTofEpAwWM0Rkk1jIEBG0Ws39IiYiAoiJ+feB2rWhCQ2FVqthIUNENomFDBH9KyYGiI4u7iyIiEzGi32JiIhItVjIEBERkWqxkCEiIiLVYiFDREREqsVChoiIiFSLhQwRERGpFgsZIiIiUi0WMkRERKRaLGSIiIhItVjIEBERkWqxkCEiIiLVYiFDREREqsVChoiIiFSLhQwRERGpFgsZIiIiUi374k6AiKggWq0GWq0Gdnb3/+4y/F+vF+j1UpypEZENYCFDRDZLq9WgiosjNHZ2yjYnJ0cAgOh0SEzKYDFDVMqxkCEim6XVau4XMRERQEzMvw/Urg1NaCi0Wg0LGaJSjoUMEdm+mBggOrq4syAiG8SLfYmIiEi1WMgQERGRarGQISIiItViIUNERESqxUKGiIiIVIuFDBEREakWCxkiIiJSLRYyREREpFosZIiIiEi1WMgQERGRarGQISIiItViIUNERESqZZUvjdy6dSt+/vlnnD17FikpKahfvz6GDBmCZ599FhqNBgAwZMgQHDlyJFfsli1b0LhxY2ukRURERCWMVQqZL7/8Eq6urpgyZQoqV66M3377DVOnTsXt27fx+uuvK+1atWqFyZMnG8W6ublZIyUiIiIqgaxSyCxduhRVqlRRfm7Xrh2SkpKwatUqjBo1Clrt/U+0nJyc4O3tbY0UiIiIqBSwyjUyDxYxBs2aNUNaWhrS09Ot0SURERGVQlY5I5OX48ePo2bNmqhYsaKy7ciRI/D29oZOp4OXlxfGjRsHX1/fR+7L3l4LO7vCa7SH2xQWY+rjpvRtaUxR9GFreZn7uDXmvrA21hp/UeVVFMd+Ub0mi+J4yesxW9jHasjL1Bhbzauo+uBxbLoiKWSOHTuGLVu2GF0P4+vri+DgYDRo0ACxsbGIiIjA8OHD8fXXX8PHx8fivrRaDSpXrmBSWycnR7Oe29T25j6vNXMp6piiyqs4+jQlxlbHX1T7uKjnUu1zb0l8UewjS+KL+ti3pbxs9XVvSYwtHy/5sXohc/v2bUyYMAFt2rTBSy+9pGwfO3asUbtOnTqhT58+WLJkCVasWGFxf3q9ICUlHXZ22kJ3VEpKBnQ6vfJzYTEPt3+YIb6wdo8SY+0+NBoNtNr7/1WsWA5paZnQ6wV6vUBEiiUvc+fFGnOfV0xeOT7u8RdVXkVx7BfVa7Iojpe8+rOFfayGvEyNsdW8iqqP0nYcOzk5WnyWxqqFTEpKCkaOHAkXFxcsWrRIucg3L+XLl0fHjh2xffv2R+43J8e0A0qn05vc1pz25j6vNXMxJ0ar1aCKSzlo7OyUbRUrlgMAiE6HxKQM6PX5FzPWyssa8daKsdXxF9U+Luq5VPvcWxJfFPuoKPKyNMYW87LV170lMbZ8vOTHaoVMZmYmwsLCkJqaiu+//x6VKlWyVlf0mGi1mvtFTEQEEBPz7wO1a0MTGgqtVlNoIUNERFSUrFLI5OTkYPz48bhy5QrWrl2LmjVrFhqTnp6Offv2oWXLltZIicwREwNERxd3FkRERIWySiEzY8YM7N27F1OmTEFaWhpOnjypPNa8eXNERkZi5cqV6NatG1xdXREbG4tVq1YhLi4OCxcutEZKNsVwDQqQ+wpuw/UoRI/CcIzx+CKigpSE9wqrFDKHDh0CAMyZMyfXY7t370b16tWRnZ2NBQsWICkpCY6OjvDx8cGMGTPg6elpjZRsxv3rUByNrkMB/r2C29RrUYjyk9cxxuOLiB5WUt4rrFLI7Nmzp9A2ERER1uja5uV7HQrAa1HoseC1TkRkipLyXlFkC+LRQ3gdClkbjzEiMoXK3ytYyJRgJeGzTyIqGXhtIFkLC5kSqqR89klE6sdrA8maWMiUUCXls08iUj9eG0jWxEKmpFP5Z59EVILw/YisgIUM0SPgdUhERMWLhQyRhXgdEhFR8WMh8xjwr/LSidchkbXZ8p0+fN8jW8FC5hHxr3Li5/5kDbZ8pw/f98iWsJB5RPyrnIiswZbv9OH7HtkSFjKPC/8qJyJrsOX3FlvOjUoNbXEnQERERGQpFjJERESkWvxoiYgsYst31BBR6cFChojMZst31BBR6cJChojMZst31BBR6cJChogsx7tWiKiY8WJfIiIiUi0WMkRERKRaLGSIiIhItVjIEBERkWrxYl96JPl9Ay7AtUSISB34Td7qxkKGLFbQN+ACXEuEiGwfv8lb/VjIkMW4lgiR7eFZUvNY8k3e3Me2hYUMPTquJUJkE3iW9BGY+D7GfWx7WMgQEZUQPEtqfdzHtoeFDBFRScOzpNbHfWwzePs1ERERqRbPyBARUYnBW6lLHxYyRERUIvBW6tKJhYxKlKS/MkrSWKj04nFseyy5lZrUj4WMCpSkvzJK0lio9OJxbON4IW6pwkJGBUrSXxklaSyW4l/y6sfjmMh2sJBRk5L0V0ZJGosZ+Jd8CVNKj2MiW8JChqgI8S95otKJZ2Kth4UMUXHgX/JEpQbPxFoXCxkiIiIr4plY62IhQ0REVBR4JtYqivUrCv766y8MHz4c3t7e8Pf3x9y5c5GVlVWcKREREZGKFNsZmeTkZAwdOhQNGjTAokWLcOfOHcyZMweZmZmYNm1acaVFREREKlJshcx3332Hf/75B4sXL4aLiwsAQKfTYcaMGQgLC0PNmjWLKzWgdu2Cf1aTkjQWIiJSJWvetVVshcyBAwfQrl07pYgBgJ49e+K9997DoUOH8MwzzxRLXqLXQxMamud2tSlJYyEiInUy5a6tR6ERkWK5VLpdu3Z49tlnMWnSJKPt7du3R3BwcK7tphK5X91pNIBWq0UKMqCD8S9uO2jhBEfo9Xo8OHpDTAayoMe/D2ihgSMccrV/MAYpKYBO90AndoCTU7595GpvSUw+7UvqWIolr5I0FlvNqySNxVbzKkljeYx5laSx2GpeRjHp6bljypeHXq+HRqOBRqOBJYrtjExKSgqcnJxybXd2dkZycrLFz6vRaGBn9+/OcIJjvm212ryvdXaEg1nt73eUeywFxuTT3pKYgvIqSWMpzrwsibHVsdhqXpbE2OpYbDUvS2JsdSyPNS9LYmx1LLaaFwCUL29+jAmK9a4lIiIiokdRbIWMk5MTUlNTc21PTk6Gs7NzMWREREREalNshUyjRo1w5coVo22pqamIi4tDo0aNiikrIiIiUpNiK2Q6dOiA3377DSkpKcq2bdu2QavVwt/fv7jSIiIiIhUptruWkpOT0bt3bzRs2BBhYWHKgnh9+/blgnhERERkkmIrZID7X1HwwQcf4MSJE6hQoQKCg4MxYcIEODjkfacNERER0YOKtZAhIiIiehS8/ZqIiIhUi4UMERERqRYLGSIiIlItFjJERESkWixkiIiISLVYyBAREZFqsZAhIiIi1WIhUwKZuzQQlxIiIiK1YiHzmOj1erPam1I83LlzBxkZGWbnotForNr+zz//RGZmplkxxcUWizQRscm8LGHJOCwdv7kx5r4mi4KI2GRelrBkDvV6PXQ6ndkx5ijKfWzOPhARs8duqyzZv5bMvalKZCFz/PhxHD9+HCdOnMC5c+eQmppaYHtLD7ALFy7g2rVrAACttuBdmZOTg23btuGPP/5Aenq6Ujzk90LIysrCgAED8M4772Djxo24fft2rrbp6em5+li1apXRF3EaYvLqJzs7G5MnT8b69etNPjCzsrLw6quvYsaMGbhz506BY3hQYmIivvzyS/z444+4dOlSrvzyEhkZiZMnT+LUqVO4cOEC0tLSTMrxQeYWaUVBo9GYnZdOp7Pqm3N8fLxZr4EDBw4gKyvL5HE8OM+WjN8QZ47CXpPFQaPRmJ2XNec+v3kv6HX5KHOv1WphZ2dnVo7m7i9L9rGlCnsff/i4N2XsD8aYM/f37t0zqZ3BzZs3kZOTk2/feY1p8+bNSE5ONnn/Pvj7x5K5N5W9VZ61mJw7dw4rV67E4cOHcffuXdjb26Nhw4Zo1KgRfHx88PTTT+OJJ54wmoR79+6hbNmyyg42HDQFTVRMTAzWrFmDjRs3IiEhAa6urhg1ahSCg4Oh1WpzxZ49exZLly7Fvn37kJOTgzp16mDu3Llo3bo1NBoN0tPTjXIA7hdjiYmJ2Lt3L/bu3YsyZcqgU6dO6N27N7y8vODi4oKXX34Z48ePR9u2bQEA33zzDTZs2ICQkBDleTQajTLGrKwso++x2rhxI44ePQp/f38l5+TkZMTFxSEqKgpVq1aFp6cnypUrZxSTkpKCPXv2IDY2FlOmTMGTTz5Z4LwcOXIECxYswOnTp2Fvb4+yZcviww8/RNeuXaHRaHD37l1UqlQJ9vb3D8dLly7hiy++wIEDB5CYmAh7e3vUqlULzZs3x1NPPQV/f3888cQT0Ov1ec5TUlISbty4gRMnTsDNzQ0eHh5wdnZWxiEi+b4JF/TYw+7du4ebN2/iypUrqF+/fqH7ITY2FkePHsXt27fh6+sLT0/PAvv+559/cP78ebRu3dro2NDpdNBqtXnmmZiYiM2bN2PQoEH5fmfZw/vt7t27mDt3Lpo3b46hQ4cWOv7Y2Fi88sorCAoKwoQJE9CwYcMC2xvG9tdff2HTpk1ITk5GUFAQ2rVrV+j+Tk1Nxd9//40TJ07A1dUVTZs2RaVKlVCuXDlotdpc8YXNvV6vz7eQMnXuzZ13oPC5f3hOzJ37xz3v+e2Hopr7/Obd0dERGo0mz3m8c+cOTp06hRMnTqBBgwZ44oknUKNGDVSvXt3oPcyUfVOQtLQ0nD17FlFRUfDw8IC3t3eBx010dDS2bt2K2NhYdOnSpdCxp6Wl4c8//0THjh2N5j4nJyfP3y/A/YL0q6++QlhYGCpWrFjoGBMTEzFt2jR4enpizJgxyvaCjoE7d+7gjTfeQIsWLTBlyhT4+voCKPh1o9PpcPbsWaxZswbp6ekIDg5GUFCQWe+zpihRhcysWbPg4OCAiRMnokOHDrhx4wZ2796NY8eO4cSJE9ixYwcGDx6MXr16KTH//e9/kZOTg379+qFjx45wdHRUHtPpdHlW93PmzMHNmzcRHByMJk2aYOfOnViwYAFq1aoFf3//XC+KBQsWQKfT4YMPPkCzZs3w4YcfYteuXbCzs0N4eDhEBN7e3ggODkadOnUgImjXrh1ef/11nDp1Ci+//DJOnz6Nn3/+Gb/88gvc3Nzg7u6Os2fPGh2069evR/v27ZUxxMXFYdu2bfjpp5/wzz//wNvbG/369YO/vz8A4Ntvv0WPHj3QvXt3AMDBgwexcuVK/P7773B2dkb16tXh5uaGl19+GX5+fgCA1atX48UXX4S7uzs++eQThIWF4Z133kHnzp2h1WrzfENYtGgRqlWrhpUrV8LDwwNTp07Frl274OjoiCVLlkCj0aBly5YYMGAAmjRpgtmzZyMzMxNhYWHw8/PDpUuX8OOPP2LHjh04efIkDh48iLCwMLRu3TrXMXD48GGsWLECv/32G9zc3BAXFwe9Xg8PDw/06dMHPXv2RJUqVYxi7ty5gzJlyqBKlSpGL678Xmx6vR5RUVFYuXIlfvnlF7i4uMDV1RUvvPACnn322bwOTRw6dAhLly7FsWPHUKdOHWzevBmzZs1C06ZNkZ6ejvLlyxv9dafRaBAREYElS5bA29sbbdq0Qc+ePdG0aVPlzS07OxvR0dGoV6+eUgQuWbIEe/fuxcCBA436T05Oxj///IM6derkmp81a9bg4sWLeOGFF6DRaCAiuHv3Lvbu3QtHR0e4urqiTp06qF69OkQE3333HTQaDQ4ePIjY2FhMmzYNzZs3L3Cfbd++HUuWLMHt27dRq1Yt7Nu3D++//z7at2+P1NRUVKpUKdd+P3bsGFasWIH9+/ejWrVqiI+Ph6OjI9q2bYugoCAEBQWhQoUKRnO/cuVKHDp0yGpzf+HCBURERJg87yKCw4cPY8mSJQXOvWFOzJ37+vXrw87OzuJ5v3DhgsnzrtFoHtvcz5gxAx06dMhz7o8fP46VK1di3759Js07AOzZswfh4eG4cOECGjRogB9//BEpKSmoV68eunTpgl69esHDw8Mo5tq1ayhTpgxcXV2N9k1+RY1er8fp06exfPly7N69G9WqVYODgwMGDBiAMWPG5Dn/u3fvxpIlS3D16lW4urpi165dmDlzJgICApCUlKS8f9vb2yv7Lzw8HCtXrkSNGjXw9NNP47nnnoO3t7fyGs/KysLp06fRsmVLpWhdvnw59u3bh9dee81oX964cQM6nQ6NGjUyGtOaNWuQmJiIrl27QqvVQqfT4ebNm9i2bRu0Wi3q1KmDxo0b48knn1QKxu+++w6Ojo5ISEjA22+/jenTp8Pf37/AgmTz5s1YsmQJsrOzUaNGDUyePBnJyckICQlBXFwcHBwcoNVqUalSpUcqbkrMl0bGxcWhW7duWL16dZ5/6e7fvx9fffUVDh8+jGHDhmHChAlITU1FQEAAatasCQCoVKkSfH190aNHD7Rp08boOVJSUnD48GFUrVoVI0aMwKJFi9C+fXsA9yvuadOm4fr169iwYYPRm+WePXswduxYfPHFF0oxsHfvXsydOxcZGRl48skn8c8//+DEiRPw8/PDggULlPibN29i8uTJqFevHmbNmoWMjAycPHkSBw4cwHfffYfMzEy0aNECgYGBCAgIwH/+8x+sW7cOHh4e0Gq1mDhxIn799Vd4enqiVq1aiIyMRFRUFEJDQxEaGorhw4cjLCxMKey6d++OmjVrYvTo0dBoNPj999/x888/w97eHsuWLUO5cuXQqVMnbNy4EU2bNsXFixcxffp0REdHY/z48bneRIH7f8F1794dX331lTIvp0+fxuuvvw6tVotWrVohLS0NR48ehZubG6ZPn46XXnoJX375pVGhEhcXh7CwMOXAP3XqFObNm4eePXsa9Wd4wx8yZAicnJyQlZWFy5cvY+fOnTh48CAcHBwQGhqKF198UXkzHDNmDCpUqAB/f380b94crq6uRn/B5fUCe+mll3Dv3j0MHToUer0eP/zwA37//XfMmzcPvXv3zhXzzDPPwM3NTfnLd9q0aXj66afh7e2N9evXIyoqCj169EBYWBiqV68OAFi4cCGWLVuGjh074tatW0hKSsITTzyBzp07Y+DAgThw4AC2bt2KOXPmKG9ogYGBGDp0KIYNGwaNRoOYmBh89dVXOHjwIJKSklC1alWEhIRgwIAByvi7deuGQYMG4aWXXoKDgwN+/PFHfPHFF7hz5w7S09NhZ2eHVq1a4b///S9atGgBf39/jB8/HvXr18eMGTOQnp6OyZMno0ePHrnm/8F5efrpp/H888/D3t4eH3zwAapWrYpWrVrhhx9+wI0bNxAYGIjXX38drq6uAIC+ffuiZs2aGDFiBBwdHXHt2jX88ssvOHjwIACgWrVqGDduHPr37w97e3v06tXL6nNv7rwX1dwXxbyLCAICAqw+9+bOu0ajQVBQENq2bYsXXngB1apVg1arxZUrV7Bp0yZs3boVWVlZGDhwIMaMGQMnJycAwNChQwEAbdu2hY+PD5o3b648BuRd0AwaNAgVK1bE8OHDYWdnh59//hkbN27E5MmTMWzYMOh0OqOzKH379oWnpycGDx4MR0dHvP/++6hRowY8PT3x7bff4ubNm2jfvj3Gjh2Lxo0bA7j/x+KCBQvQtWtXXL16FefPn4erqyt69uyJl19+Gb///ju+/fZbfP7553B0dISIGM2/VqvF5cuXERERgUOHDiE+Ph5VqlRBSEgIhg8fDicnJ3Tv3h0DBw7E0KFD4eDggLVr12LVqlVITU2FiCA1NRVPPPEEJkyYgMDAQIgI2rdvj9GjR6Nt27aYOnUqzp8/j1dffRXDhg1DmTJl8jz2e/TogS5duuC5556Dk5MT5s2bh4SEBLRs2RLr169HXFwc2rRpg9GjR8PHxyffY6hQUkKcOnVKOnfuLLt27RIREb1eL1lZWZKdnW3U7rvvvpM2bdrI8ePHZcuWLRIQECDh4eGybt06mTBhgvTu3Vvat28vISEhsmjRIrl48aKIiFy7dk3c3d1l2rRp8uyzz0pcXJzR8167dk2eeuop+eyzz5Rtt2/fliZNmkjXrl0lPj5e9Hq9iIicOXNG3N3dZf369Urb48ePS/PmzZX8H3zeHj16yMyZMyUrK0tERBISEqRFixbywQcfyMSJE8Xd3V0mTJggffr0MXq+Fi1ayA8//KBsS05OlpkzZ4qPj49ERkZKWFiYTJo0SURETp48KS1btpQrV64Y9R8XFyd+fn4SEREhc+fOlf79+0taWpqyj8+ePSsvvfSSNG/eXN5//32JjY0VERGdTiciIgcPHpSgoCA5deqU8pyXLl2Spk2byo4dO4zG6e3tLdOmTZPOnTsr7fV6vfJcO3fulJdffllERBYtWiTPPvusJCQkKM9x8eJF8fHxkfPnz8vDdDqdXLhwQWbNmiX+/v6yePFiJRd3d3fx9vYWd3d36d69u8yaNUt2794t0dHRRsdPYmKizJ8/X/73v/+Jn5+fnD592qiPMWPGSJ8+fYyOjZycHPn000/F29tbzp49azQ/gYGB0rlzZ5kwYYK8//770q5dO3n++eeV+OjoaHn22Wdl5MiRsnfvXpk/f74MHjxYOnXqJEFBQdKqVSsJCQmR5ORkEbn/GvD09JTr168r/QwePFj8/Pxk0qRJMnPmTHnllVfEx8dHPv/8cxG5f4z26dNHNm/erMS0bdtWpkyZIkeOHJG4uDjZuXOnDBgwQNq3by+//PKLtGjRQi5fviwiIocPH5Y+ffqIt7e3rFixQu7du6fMm8GFCxfE19fXaF5u3Lgh/v7+EhQUJO+//758+umnyv6IioqS8+fP59pnIiJ3796V0NBQeeutt2TWrFnSs2dPOXToUJHM/dtvvy2tWrUyed7XrVsnW7ZskVatWll17oti3i9evCinTp2y+txv377drHkXEYmKihIfH59c82KQmpoqq1atkvbt28uUKVPk3r17EhUVJe7u7tK5c2dp06aNBAUFybhx4+Srr76SyMhIZSwiIvHx8fLuu+/K+vXrxc/PT86dO2f0/LNnz5aOHTvKjRs3jOb//fffF29vb6OxX758WRn7Rx99JCtXrpTu3btLly5dlPfe1NRUGTFihDzzzDNy6NAhWbdunYwdO1YCAgLEw8NDPD09ZcCAAZKYmCgi91/3Xl5eRv0/++yz0rFjR5kzZ46sWrVK3nnnHfHw8JC3335bbt26JSEhIUa/f3x9feWDDz5Q5vbUqVMycuRI8fLykj/++CPX3F+8eFFGjhwpLVq0kFmzZklqamqu/X7x4kXx9fU12l/x8fHSpk0b6devn6xYsULWrVsn//nPf6RVq1Zy9OjRPOfPFCWmkNHr9RISEiIhISESHR2d6zHDgZmQkCDPPfecfPjhh/LTTz+Jt7e3sqPT0tLk6NGjsnTpUnnllVekW7du0rFjR3n55Zfltddek1atWsnixYtl2LBhcufOHeW5Db9ow8PDpV27dsov859//lmaN28uY8aMMXqTe+utt2TQoEGSmZmpbEtKSpLBgwfL/PnzlW2G5z116pQ888wz8ssvv4jI/WKsbdu28vfff8u9e/fk+vXrMnToUHF3d5fXX39dIiMjZerUqfL6669Lenq6iNx/YYmIXL16VTp06CCrVq2SDRs2SLdu3eTkyZNy8uRJef755+XChQsiIpKenq6MbfLkyTJs2DDp0KGDRERE5Ln/58+fLz4+PvLmm28aFRe3b9+WgIAAGTNmjCQkJMitW7ckLCxMBgwYIP/8849kZ2eLTqeTe/fuydixY2XEiBHi7+8vb7zxRq4Xx9KlS6VTp04icv+XUPv27Y0O/j///FOCgoJkz549eeYocr+YW7p0qbi7u8uRI0dk3bp10qVLF/ntt9/k7NmzMnHiRPH09JRmzZrJoEGDZMmSJfL7779LfHy8/P777+Lu7i5vv/22DB8+XO7evSsiohxb58+fl/bt28uSJUuU/q5evSrNmzeXZ599VhITE5U53bVrl7Ro0UIOHDig7O+dO3eKu7u7sk1E5Pr16/LCCy/Id999pzzfpk2bZOLEidKsWTNp27at9OnTRyZPniyTJ0+W3r17K/t///794uvrK7t371ae7+bNmzJ9+nRxd3dXjvuwsDD58MMPRUTk119/lXbt2klMTIzRfrt8+bK0bdtW+vfvLyNGjFCKasP4p06dKl5eXvLhhx/mmrcdO3ZIz5495cSJE8q2vXv3SosWLZSCNTs7W44fPy5PPfWUfPnll7Jt2zYJDAyUP//8U3nc8Avyhx9+kKCgIElOTpb3339funTpohTM1pz7Jk2ayMCBA02ed29vb3nzzTflpZdesurcBwUFSc+ePa0678uXL5c333zT6nM/ZcoUs+Y9JSVFoqKipEePHvLTTz8Z9f3ge3NWVpb89NNP4u7uLjt27JAff/xROnXqJPv27ZMrV67InDlzpGfPnsov2XfffVd++uknuXr1qhw+fFjc3d3l3XfflWHDhkl8fLzynCL3i86ePXvK1KlTjea/SZMmEhwcLHFxccoY9uzZIx4eHnLkyBGlraEQebCoTElJkVdeeUUpumNjY+Xo0aMyd+5cadasmXh7e0urVq1k8ODBMnnyZAkMDFR+xxw8eFB8fX3lt99+U57v7t27smTJEmnSpIkcPXpUJk6cKG+++aaIiBw9elT8/f3l9u3byn4Tuf966datm8ybN08mT54sI0eONJp7kfvvyV5eXvLaa68pRY7BwYMHpUePHkrBaRi/p6dnrsK2Q4cOsnDhQrGU7V3WbyGNRoPp06cjLS0NkyZNwtq1a/HXX38pV9cbTr1XqlQJFStWRFZWFtq3b4+pU6eiWbNmAIAKFSqgdevWePXVVzF79mxMmTIFffr0QWZmJvbs2YPg4GB4e3sjLS0NLi4uSr+Ga0Oee+452NvbY+3atQCAn376Ce3atUPnzp1RrVo1JdcWLVrglVdeQdmyZZVtWq0WDg4Oua7wFxF4eHigV69emDt3Li5cuICNGzeiU6dOqFWrFhwcHODm5oZx48Zh/PjxuHXrlvIRU5MmTVCmTBnluQDAyckJ1apVQ0pKCnr27AkvLy+MGTMGGzZswJUrV3Ds2DEAUC6qS09PR0JCAqpXr47nnntOuZ7GwHDHw4gRI/Dqq69i69atGDp0KA4dOgSdToeaNWti7NixOHfuHP7zn/+gW7ducHR0hLOzMxwcHGBvbw+tVoucnBzcu3cPdevWxaRJk3D48GG89957+Omnn3Do0CF88803CA8Px/PPPw8AcHZ2Vj4uM2jWrBlq1KiBZcuW4cKFC8p2vV6v7FcnJyeMHDkSvr6+OHjwoPL5cM2aNdG8eXN88sknysdWDg4OWLhwIV577TW88847WLx4MWrVqoXKlSsjKSlJuTDccGw1bdoUAwcOxKpVqxAdHQ0A2LdvH+zs7NCgQQOUKVNGmYcNGzagbdu2ykeYjo6OaNeuHdq2bYvTp08r+7ZevXoYMmQI1q5diyNHjqBBgwbo3bs36tevjxo1auDll19G/fr1kZCQgHPnziE+Ph5vvvkm1q5di8WLF6Nr167o2LGjsh/q1KmDsLAwVKtWTemnXbt2+Pnnn7Fp0yblugLDvBr2W6NGjdC5c2ecO3cO3bt3V46rnJwcODg4YPTo0Rg4cCBWr16NcePG4eLFi8r+9/LyQlZWFr799ltcunQJBw4cwPLly9GmTRvl+gp7e3t4enqiY8eOOHfuHFq3bg2tVouff/4ZWVlZykcIwP2L+itXrgwnJycMGzZMua3T2nNfoUIFo7tICpv3cuXKoUyZMqhevbpV5z4uLg6JiYlWnfcTJ07gf//7n9XnPiMjw6x5P3v2LOrXr4/GjRvjs88+w/79+5UlKx68vrFMmTLo378/unbtisOHD6NChQpwdHSEm5sbGjZsiMmTJ2PLli34+OOP0bRpUxw8eBDz5s3D22+/jdmzZ8PV1RU1a9ZETEyMsm8M+8HwseGPP/6o7Nt9+/bB0dERTZs2hYODgzKGdevWwdfXF97e3so+evLJJ/H000/j7NmzytxXqlQJoaGh2LZtGzZu3Ijq1aujdevWKFu2LGrVqoUZM2YgJCQEzs7OiI+PR1paGoYOHYqPPvoI8+bNQ5cuXZSLcfV6PVxcXPD888+jfv36iIyMROfOnbFjxw4sW7YMsbGxqFGjBpKTk5W51+v1qFSpEtq3b4/Tp09j48aN6Natm9HcA8DgwYMxevRoHD58GJMmTcLx48eVcbVs2RL29vYIDw/H/v37sXHjRoSHh8PT01P5GA0A6tSpg/bt2+Py5cuwmMUlkI3666+/ZMyYMeLl5SX9+vWTjz76SDZu3ChHjhyRhIQE+eSTT6R169ZGH108yFDBP2jz5s3i7u4uZ86cERHJ9XHVg5YvXy5eXl6ye/du8fT0lD///DNXH3k5c+aM+Pj4GH0E87A5c+ZI69atxd3dXfbv35/rcb1eL8nJyXLo0CFZuHChbNq0KVebc+fOiZeXl9JPRkaGLFq0SLp37y7u7u7i7u4uI0eOlB9//FFOnTolY8eOFX9/f2Xshfn111+lb9++EhAQoPzlYji1v27dOtm3b59cv35dWrVqJcuXL5cbN26ITqeTjRs3iq+vr5w6dUp0Op388ccfEhISIl5eXuLv7y/e3t4yceJEZV9eunRJ+YjsQUePHpWAgADp2rWrfP3115KSkpIrx9TUVBkwYIAsXLhQ/v77b/n2229F5P68Pjy3ycnJ8tVXX0mvXr3E3d1dli5dKgcPHpRx48blOf6UlBTp1KmTzJgxQ7KzsyU4OFjefPPNXH8t7tu3Ty5dumS0LS4uTkJCQvI86zV//nzx8/OTgwcPiohIYGCg8hdMZmam3Lp1S44ePSqffvqpvPDCCxIYGChPPfWUfPPNN8o+M/z/9u3b0qtXL/nyyy+V53/vvfekY8eOMmPGDGnXrp0sWLBAOXVtiAkODpYRI0YYnXF72NatW6Vz584yYMAAo9dYeHi4NG/eXPz8/KRDhw7y3//+VzlL9eC+fuaZZ5SPZ1euXCnu7u4yaNAg+f777+XQoUMyc+ZMadGihbI/Y2JipG/fvrJu3To5cuSIBAQESJcuXUya++joaFm7dq2ImDb3U6ZMkTFjxuQ57rzm/aOPPpLz588bfbwrYtrcP/ieUdjcb9u2TebPn2+1eR8wYIDMmTNH1q1bp7ym85Lf3C9dutSsuV++fLlZ8y5y/wxISEiItGnTRubOnSvnz5+XzMxMo/2YmJgozzzzjMyfP19iY2Nl27ZtInJ/7g1nrA1SU1Plf//7nwwfPlzc3d1lyZIlcurUKZkwYUK+4+/Xr5+MHTtWMjIyJDg4WN566y2lD4OoqCi5du2a0baEhAQZOHCghIeHG82XiMj3338vXl5eyjEUGBgoCxYsUPJOTEyUc+fOyTfffCOTJk2SPn36SJs2beSLL75QfpcZni8uLk569+4tK1euFBGRFStWSFBQkIwfP17atm0r06ZNMzojd/36dRkwYIB8/PHHsmfPngJf9ydOnJD+/ftLx44d5ZdfflH2508//SSdO3eW9u3bi7+/v3z88cfSq1cv+fvvv5XYpKQkefbZZ+XTTz/N9/kLU+IKGYO7d+/Kl19+Kf7+/uLv7y+dOnVSPhN98IWcH8Pk37t3Tz744APx9vY2qd/k5GTp06eP+Pn5KR+D5PfchgMtNjZWZs6caXSNS16ysrJk0aJFMn36dOU0YH6ys7OVj5UMb9Dx8fEya9Ys6d69e672qampsmXLFhk0aJC0a9dOvL29pVmzZjJgwADZsmVLwYMW4xff4cOHC3zBi9wv+Hx8fGTQoEHK/po2bVqudoZrAK5duyYZGRkiInLnzh2ZOnWq9OzZM8/nvn37trz11lvi7e0t3t7eMm7cONm0aZMcPXpUdu7cKe+88460bdtWbt68mW9+OTk5Rm9uhtPLhhe64TqhvGzYsEFatWolmzdvlmbNmuX6qDM/R44ckZYtW+ab15w5cyQ0NFS2b98uTZs2zbdITk9Plz179sisWbNk48aNImI8P0ePHpUWLVrIzZs3jY7zJUuWKK8Tw8eUK1askFWrVsnQoUOlc+fO+R53Op1O9Hq9ZGdny86dO6Vz587i4eFhVEwkJCTIhg0b5MSJExITEyNdunSRb775Ru7duydxcXESHh4uTz/9tNy6dUuJ+e2335TrO5o1ayaBgYEye/Zso7F4eHgo++zWrVvy3//+V7y8vMya+wc/wiho7vV6vTLOh/d9YfNe0B9Aec39g89vytynpaXJzp07ZebMmYXOu4HhD5kOHTqYNe8P7h9T5j4+Pl6+//57OX78uElzf+jQIXn55ZeV96HC5l3k/nvYvHnzpF27duLh4SGDBw+W8PBw+d///ifffvutjBo1SgICAoyOL0P+D47rwXn67bffjF73ecUY9vHevXvFw8ND1q1bl2v+8/oD2eDw4cPi6emZ7+t+9erVMnjwYPnhhx+kWbNmcuLEiTxf9/fu3ZOjR4/KihUrlOsPH+z3jz/+kBYtWihFxL179+Sbb76RoKAgZe4HDBgg7733nsybN0/69+8v3bt3zzX3Dz6nTqdTjoVjx47JwIEDxd3dXZKSkpQ2KSkpsmvXLvnrr7/k7t270qdPH/n444/l6tWrEhUVJfPmzRN/f/9c82KOEnPXUkHu3LmDS5cuoXz58qhevTrq1atncmxOTg7Wr1+PnJwcDBkypMC28v9Xba9fvx5Tp07FhAkTEBYWVmgfK1aswK5du/Diiy+iX79+hfaRmZlpdJu4qZYsWYKNGzdi5MiRRmvNPOzu3buIi4uDo6MjKlasiMqVK5vdlymio6Px448/4ubNm/D390fnzp2N7hrIz7Vr17Bz5040bNgQXbt2BWC8qKG9vT3u3buHM2fO4NChQ/j1119x8eJFiAicnZ1RpUoVjBo1Ct27d0d2djbKlClT4G1/aWlpmD17No4ePYrt27crizvlJykpCaGhoTh79iw8PT2xZs2aQtf2uHDhAsLDw5GQkICvvvoKer3eaG0jrVaLlJQUvPPOO9i9ezf8/PywcOFCODs7Kyvl5uTkwM7OzuiuCcP4cnJyYG9vj6ioKCxevBjx8fFYs2aNsh6HYTx37tzB0aNHsXfvXhw8eBDZ2dmoWrUq6tWrh9dffx2enp4mLWp148YN/PLLLxg1ahSys7Oh1WqV20cNFi1ahM8//1y5jTUzMxODBg3C2LFjkZ2drXzsePfuXaSnpyM9PR3lypVD3bp1Adw/fpYtW4YbN27gnXfeQZkyZZRT1pGRkdi3b58y94bT64a579GjB86dOwdHR8cC10J5cO4XLVqEcuXKoX79+vnO+4gRI3DmzBl4eXnh+++/x/nz51GuXLk8+8hr7levXo2LFy+ibNmyaNCggdI2OTkZ7777bp5zf/78eZQtW9bodP3D83758mUsWrQI8fHxWLt2LS5cuAAHBwc0atQIwP11RQ4dOoR9+/blmvcxY8bA29sbFy5cQLly5YzyKmjuR48ejfPnz8PBwcEot4LmPigoCGXLllXyunPnDlJSUvKd91WrVmHXrl1wdnaGn58f7OzsEBMTg4MHD2L37t34888/kZ2djcqVK6NOnToYPXo0fH19sWPHDlStWhUtW7ZE+fLlAeS+Qy0tLQ1z587Fb7/9hm3bthUak5mZiVdffRW///47vLy8MHTo0EL7iIyMxPLly5GRkYHw8HDs3r0bLi4uSoxer8e9e/fw/vvv46effkKbNm2wcOFCuLi4KK/5nTt3onLlynjqqaeU9xnDmmGGY+zs2bNYsmQJkpOTMWTIEDg7O+Opp55SPio6duwYduzYgQMHDiAnJweOjo5o0qQJRo8ejbp162LXrl2oUqVKgWMB7i/SunnzZgwYMAA7duxA5cqVlXkx+PbbbzFnzhwAQLly5VC2bFkMHToUoaGhBR5XBSkVhUxRExFcunQJtWvXNukXs16vR2JiIpydnZUDyxr0ej3u3LmDqlWr5vuLtTjk9YIojOGX9oML/hk8eNtkVlYW0tLSkJ2djb///hsigmbNmikL8z0YA+S9EGJmZiY2bNiAWrVqKYVTYTHfffcd3nvvPbz//vsYNGhQoe3Xrl2LLVu2IDQ0FIGBgfn2ceHCBXz77bdo3749AgMDodVqc40/JycHer0+zwJtzZo12LBhA8LCwoxuXc/Jyclz5dHLly+jYsWKcHZ2NiqeCxqLYf8/vEZITk4ORMToGP/tt99w4sQJxMfHo2vXrvDy8sp3Qa+HnTt3Dps2bUJsbCwOHz6MhIQE1KlTB+PGjUNwcDAyMjKQkZFhNPdNmzZFamqqyQtaZmZmIiIiAhcvXsSxY8eQmJgIV1dXjB49Gv369cvV/rvvvsP06dPxxhtvICkpyaQ+1qxZgy1btmDQoEG4dOlSnjH29vY4f/48vvvuO2Xu79y5YzSOOnXq4LXXXkP//v1hZ2dn1MfXX3+NH374AS+++CKuXbtmFDN69Gj0799fmU+NRqPMe/Xq1REbG2vy/jLcfnzjxg18//33uXIbMGCAUtA+OPc+Pj44f/48fv75ZyQkJMDNzQ1jxoxB7969cxXA586dw759+1CrVi3s2bNHWWi0Vq1amDdvnrJsQ3p6OhwdHXH16lVotVq4urri0qVL+S5OaogxLE6alZWFAwcO4O7du9i/f79JMVu3bsX48ePRtGlT/PXXX4W2X7t2LbZu3YrevXsrhWReMdeuXcP27dvx1FNPKWvKPLzQau3atTFnzhzl2qsH+1mzZg3WrFkDFxcXnDlzRtlfc+bMURZUNYiNjUXFihVRvnz5AhdzfbgPQ/F8+vRphIeHG83L3LlzleVHAOCvv/7CxYsX8ddff6FTp07w8PB4pAXyWMiQ6o0dOzbfRQ0ticlvIURzYwYPHoxKlSohODi40PYpKSnIzs7GjBkzCuzDUGg8uEqzOXnFxMQgOzsbH3/8MXQ6XZ4xer0eer3e6BeIOX0YCtOCYgxnCsyZl+zs7Fy/oMeNG4ebN2/Cz88PTZo0wfbt2xEZGYmPPvoIAQEBuZ4/r5gdO3YgMjISc+bMQUBAQK71Q8xtf+TIEaxZswa3bt0yKeaff/5BZmYm3n///QL7MTDMvTl5xcbGIjMzE5988kmumFOnTin7K695MXf8psQ8/MdLYfP48PoswP0bDAzHcLNmzTBz5ky0aNECPXr0wPLly6HT6dCqVSsMGjRIOaucV4yHhwd69OiBZcuWQUTg4+ODfv36oU6dOhbFDBkyBHZ2dggODi6wfXBwMGrXro2srCyMGjWqwD4cHBzQokUL9OzZU/lEwdy8DGsMPdy+e/fuWLZsGXJycuDr64uBAwcqN6c87v21dOlS6PV6PPXUU3juueeUm2YemcUfShHZgLi4OHF3d5cOHTpIhw4dpHfv3jJ9+nT5/fffc7VNTEyUrVu3yrFjx0yOSU5Oli1btsjx48dNjrl7966sW7fO5PYpKSmyfft2s/JKSUmRbdu2mRWTmpoqO3fuNCvG3LEkJyebnVdSUpJs3rzZ7Ji1a9dKy5YtjW5ZvnHjhgwbNkw6d+5sdHFiTk6OnDhxQqKiosTLy8ukGJH7t0p7enqa1F6n01nUx8mTJ+Xy5ctmxRhuJjC1/alTp8zKy9KxmBuj1+tlx44dJo9Fr9fL8ePH5fLly9KiRQv5448/lMf27NkjPXr0kI4dO8qIESPk+eefl6ZNm8rgwYMlISFBYmJiTI556aWXJD4+Xm7fvm1yzJAhQ+TcuXNmtY+LizOpj0GDBkmzZs1k6NChFo3l/PnzZuVlSR/mxgwePNjo1vRHwUKGVM2SRQ3nzZtndszHH39scoxhDQk/Pz+T25vbhyVjsbQfc8Zi6f6yZF6aNGki3bp1M3lxSksXtLRmHzExMeLu7i5Tp061Wl6GPswde1HFWLKP33rrLRkwYIBZC41GRERYPWby5Mk2mdeUKVNsMq+HF4C1VIn6riUqfe7du4e0tDS0b98ezZo1Q69evXD+/Hnl+7V+/vlnbNiwAY0bN0bZsmVRoUIFNG7c2OyYJ554wqwYw5d0WrOP0j4WBwcHuLq6KtfryP9f9Fy/fn288sor+PLLL/Hcc8+hevXqOHLkCBwdHVGjRg3cuHHD5BjDd/FYq4+jR4/C0dERNWvWRHR0tFXyMvRh7tiLKsaSfezs7Aw3Nzejj6jWrl0Lb29v9O3bV3l/aNy4MVq1aoXIyEhkZWVZPebKlSs2mddff/1lk3lFRkaiS5cueFQsZEjV8lvUsHXr1khMTMTJkyfx559/4sSJEzh06BBeeOGFIol55pln0Lp1a5vLqySNpXPnzoiPjzdanNLwzcjPPfcc1qxZg7Vr12L8+PHYuHEjAgMD4e3tjX379pkcY/guMGv2UZLyKoqxdO7cGX379sXFixdzLTTatWvXPBca1ev1Vo8pU6YM6tatC19fX+ZlYow8rkt0H8t5HaJiZMmihkURY6t5laSxmLs4pYj5C1oWRR8lKa+iGoslC40WRQzzejwLwJqjxHxFAZVeD9+29+DdM8D9uzz+/PNPODo6okWLFkUWY6t5laSx5HXnk8GgQYNQt25dvPXWW6hSpYry7brmxhRFHyUpr6Iay8PHiuEYMXxEFRcXh40bN8LV1RWenp5FFsO8zI95VCxkqMQyvKC0Wi0aN26MiRMn2kSMreZlSYyt5iUicHJywksvvYTk5GQ899xzhfZhbkxR9FGS8rL2WB48RgBg48aNiIyMxMiRI4s1hnmZH2MuriNDRCWWmLk4pSUxRdFHScrLkhhL+rBkodGiiGFej38BWBYyREREpFr8aImIiIhUi4UMERERqRYLGSIiIlItFjJERESkWixkiIiISLVYyBBRibVo0SK4u7sXdxpEZEUsZIiIiEi1WMgQERGRarGQISKbkJ6eXtwpEJEKsZAhoiJnuHbl8uXLeOONN+Dr64sXXngBAPC///0PzzzzDDw9PeHn54cJEyYgJibGKP7YsWMYO3YsOnXqBA8PD3Ts2BGzZs1CZmZmcQyHiIpR/l85SkRkZePGjUP9+vUxYcIEiAiWLl2KhQsXomfPnhg4cCASExOxZs0avPjii9i4caPyPTvbtm1DZmYmnn/+ebi4uCAyMhJr1qzB7du38dlnnxXzqIioKLGQIaJi07RpU3zyyScAgJs3b6Jbt24YP348Xn31VaVNUFAQBgwYgG+++UbZPmnSJJQrV05pM2jQINSvXx/z58/HrVu3UKdOnaIdCBEVG360RETF5rnnnlP+vXPnTuj1evTs2ROJiYnKf9WqVUP9+vXxxx9/KG0fLGLS09ORmJgIHx8fiAjOnTtXpGMgouLFMzJEVGzc3NyUf1+7dg0igqCgoDzb2tv/+3Z169YtfPbZZ9izZw+Sk5ON2qWlpVknWSKySSxkiKjYlC1bVvm3Xq+HRqPBihUrYGdnl6tt+fLlAQA6nQ7Dhw9HcnIyRowYgUaNGqF8+fK4c+cOpkyZAr1eX2T5E1HxYyFDRDahXr16EBG4ubmhYcOG+ba7dOkSrl27ho8++gj9+/dXth86dKgIsiQiW8NrZIjIJgQFBcHOzg6LFy+GiBg9JiK4e/cuAECr1SrbHnx89erVRZcsEdkMnpEhIptQr149jB8/Hp988glu3ryJrl27okKFCvj777+xa9cu/Oc//0FoaCgaNWqEevXq4aOPPsKdO3dQsWJFbN++HSkpKcU9BCIqBixkiMhmvPLKK2jQoAG+/PJLfP755wCAWrVqwd/fH4GBgQCAMmXKYNmyZZg5cybCw8NRtmxZdOvWDS+++CKCg4OLM30iKgYaefgcLhEREZFK8BoZIiIiUi0WMkRERKRaLGSIiIhItVjIEBERkWqxkCEiIiLVYiFDREREqsVChoiIiFSLhQwRERGpFgsZIiIiUi0WMkRERKRaLGSIiIhItVjIEBERkWr9HwVgYPGDaABkAAAAAElFTkSuQmCC\n",
"text/plain": [
"<Figure size 640x480 with 1 Axes>"
]
},
"metadata": {},
"output_type": "display_data"
}
],
"source": [
"def classes_plot(y_val,y_pred):\n",
" vd = pd.DataFrame([y_pred,y_val],index=['pred','real']).T\n",
" vd_pred_true = vd[vd.pred==vd.real].groupby(by='real').count()\n",
" vd_pred_all = vd.groupby(by='real').count()\n",
" vd_pred = pd.concat([vd_pred_true,vd_pred_all-vd_pred_true],axis=1)\n",
" # vd_pred.false[vd_pred.isna().iloc[:,0]]=vd.real[vd_pred.isna().iloc[:,0]].values\n",
" vd_pred.columns = ['true','false']\n",
" #print(vd_pred_all.pred[vd_pred.false.isna().values])\n",
" #print(vd_pred_true.pred[vd_pred_true[vd_pred.false.isna()]])\n",
" vd_pred.false[vd_pred.false.isna()]=vd_pred_all.pred[vd_pred.false.isna().values]\n",
" vd_pred = vd_pred.fillna(0)\n",
" vd_pred_sum = vd_pred.sum()\n",
" print(vd_pred_sum.true/(vd_pred_sum.true+vd_pred_sum.false))\n",
" return vd_pred.plot(kind='bar',stacked=True,color=['#66FF99','#ff6666'],rot=70)\n",
"\n",
"classes_plot(y_val, y_pred)"
]
},
{
"cell_type": "code",
"execution_count": 49,
"id": "78fc9075-6f7f-442a-addc-42eee1a6d83e",
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"0.6523235800344234\n"
]
},
{
"data": {
"text/plain": [
"<AxesSubplot:xlabel='real'>"
]
},
"execution_count": 49,
"metadata": {},
"output_type": "execute_result"
},
{
"data": {
"image/png": "\n",
"text/plain": [
"<Figure size 640x480 with 1 Axes>"
]
},
"metadata": {},
"output_type": "display_data"
}
],
"source": [
"#fit svc\n",
"\n",
"import numpy as np\n",
"from sklearn.pipeline import make_pipeline\n",
"from sklearn.preprocessing import StandardScaler\n",
"from sklearn.metrics import f1_score\n",
"\n",
"from sklearn.svm import SVC\n",
"clf = make_pipeline(StandardScaler(),\n",
" SVC(gamma='auto'))\n",
"clf.fit(X_data, y_data)\n",
"y_pred = clf.predict(X_val)\n",
"classes_plot(y_val, y_pred)"
]
},
{
"cell_type": "code",
"execution_count": 36,
"id": "2e8eeba1-44d6-4036-8413-785cc99bc9c9",
"metadata": {},
"outputs": [],
"source": [
"#fit random_forest\n",
"\n",
"import numpy as np\n",
"from sklearn.pipeline import make_pipeline\n",
"from sklearn.ensemble import RandomForestClassifier\n",
"from sklearn.metrics import f1_score\n",
"\n",
"from sklearn.svm import SVC\n",
"clf = make_pipeline(RandomForestClassifier(n_jobs=-1))\n",
"clf.fit(X_data, y_data)\n",
"y_pred = clf.predict(X_val)\n",
"classes_plot(y_val, y_pred)"
]
},
{
"cell_type": "code",
"execution_count": null,
"id": "2cc2f449-c297-4294-a03e-235d76a5ad7f",
"metadata": {},
"outputs": [],
"source": [
"#fit Linear SVC\n",
"\n",
"\n",
"from sklearn.pipeline import make_pipeline\n",
"from sklearn.naive_bayes import MultinomialNB, ComplementNB\n",
"from sklearn.metrics import f1_score\n",
"\n",
"from sklearn.svm import LinearSVC\n",
"clf = make_pipeline(LinearSVC(C=1000, penalty='l1', max_iter=500, dual=False))\n",
"clf.fit(X_data, y_data)\n",
"y_pred = clf.predict(X_val)\n",
"classes_plot(y_val, y_pred)"
]
}
],
"metadata": {
"kernelspec": {
"display_name": "hack",
"language": "python",
"name": "hack"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.8.10"
}
},
"nbformat": 4,
"nbformat_minor": 5
}