From 68b3c544d5c47d5871a46e62bbe175477b0cde2f Mon Sep 17 00:00:00 2001 From: mauryaland Date: Fri, 21 Sep 2018 10:38:13 +0200 Subject: [PATCH] Adding French hyphenated first name (#2786) --- spacy/lang/fr/_tokenizer_exceptions_list.py | 496 +++++++++++++++++++- 1 file changed, 495 insertions(+), 1 deletion(-) diff --git a/spacy/lang/fr/_tokenizer_exceptions_list.py b/spacy/lang/fr/_tokenizer_exceptions_list.py index eb6d5bbce..3265c5f97 100644 --- a/spacy/lang/fr/_tokenizer_exceptions_list.py +++ b/spacy/lang/fr/_tokenizer_exceptions_list.py @@ -31599,5 +31599,499 @@ FR_BASE_EXCEPTIONS = [ "σ-additivités", "σ-compacité", "σ-compact", -"σ-compacts" +"σ-compacts", +"Abbie-Gaëlle", +"Abby-Gail", +"Aëlle-Lys", +"Agathe-Rose", +"Aimée-Alexandrine", +"Amy-Lee", +"Andrée-Ange", +"Anna-Elisa", +"Anna-Maria", +"Anna-Sophia", +"Anne-Aëlle", +"Anne-Aymone", +"Anne-Catherine", +"Anne-Cécile", +"Anne-Christelle", +"Anne-Claire", +"Anne-Clarisse", +"Anne-Clémence", +"Anne-Clotilde", +"Anne-Colombe", +"Anne-Eléonore", +"Anne-Elisabeth", +"Anne-Flore", +"Anne-Gabrielle", +"Anne-Gaëlle", +"Anne-Garance", +"Anne-Hélène", +"Anne-Hortense", +"Anne-Isabelle", +"Anne-Juliette", +"Anne-Laurence", +"Anne-Lise", +"Anne-Louise", +"Anne-Lucie", +"Anne-Lyse", +"Anne-Marceline", +"Anne-Marguerite", +"Anne-Mathilde", +"Anne-Pascale", +"Anne-Pénélope", +"Anne-Raphaëlle", +"Anne-Sixtine", +"Anne-Victoire", +"Anne-Yvonne", +"Annie-Claire", +"Annie-Claude", +"Annie-Christine", +"Annie-Flore", +"Annie-France", +"Annie-Françoise", +"Annie-Laure", +"Annie-Paule", +"Annie-Pierre", +"Annie-Rose", +"Annie-Thérèse", +"Audrey-Anne", +"Aure-Anne", +"Bérénice-Marie", +"Blanche-Castille", +"Brune-Hilde", +"Carla-Luna", +"Carla-Marie", +"Carole-Anne", +"Catherine-Amélie", +"Catherine-Josée", +"Catherine-Luce", +"Cécile-Liv", +"Cécilie-Anne", +"Claire-Aude", +"Claire-Juliette", +"Claire-Marie", +"Edith-Marie", +"Eléa-Nore", +"Elée-Anne", +"Elisa-Maude", +"Elise-Marie", +"Elyse-Ea", +"Elysée-Anne", +"Emma-Line", +"Emma-Lou", +"Emma-Louise", +"Emma-Rose", +"Eugénie-Héloïse", +"Eva-Elle", +"Eva-Marie", +"Eve-Aëlle", +"Eve-Angéline", +"Eve-Rose", +"Eve-Charlotte", +"Eve-Marie", +"Gracie-Lou", +"Hélène-Sarah", +"Héloïse-Luce", +"Héloïse-Marie", +"Jeanne-Antide", +"Jeanne-Claire", +"Jeanne-Charlotte", +"Jeanne-Cécile", +"Jeanne-Colombe", +"Jeanne-Françoise", +"Jeanne-Hélène", +"Jeanne-Laure", +"Jeanne-Lise", +"Jeanne-Louise", +"Jeanne-Marie", +"Jeanne-Sixtine", +"Jeanne-Sophie", +"Julie-Anne", +"Julie-Maude", +"Julie-Michelle", +"Josée-Anne", +"Laure-Anne", +"Laure-Eléa", +"Laure-Élise", +"Laure-Lise", +"Laure-Lou", +"Laure-Marie", +"Laurie-Anne", +"Léa-Jade", +"Lily-Rose", +"Lisa-Marie", +"Lise-Anne", +"Liv-Helen", +"Lou-Anne", +"Lou-Eve", +"Louisa-May", +"Louise-Marie", +"Louise-Anne", +"Louise-Hélène", +"Maëlle-Anne", +"Maëlle-Lys", +"Maï-Lan", +"Marguerite-Marie", +"Marie-Adélaïde", +"Marie-Adeline", +"Marie-Agathe", +"Marie-Agnès", +"Marie-Aimée", +"Marie-Aldine", +"Marie-Alice", +"Marie-Aline", +"Marie-Alix", +"Marie-Amélie", +"Marie-Andrée", +"Marie-Anne", +"Marie-Astrid", +"Marie-Athéna", +"Marie-Aude", +"Marie-Bérénice", +"Marie-Carmèle", +"Marie-Caroline", +"Marie-Cécile", +"Marie-Charlotte", +"Marie-Clarence", +"Marie-Clémence", +"Marie-Clémentine", +"Marie-Clotilde", +"Marie-Colombe", +"Marie-Dominique", +"Marie-Edith", +"Marie-Elisabeth", +"Marie-Ella", +"Marie-Elle", +"Marie-Emeline", +"Marie-Eve", +"Marie-Flore", +"Marie-Gabrielle", +"Marie-Garance", +"Marie-Héloïse", +"Marie-Hortense", +"Marie-Isabelle", +"Marie-Jeanne", +"Marie-Josée", +"Marie-Josèphe", +"Marie-Juliette", +"Marie-Léonor", +"Marie-Liesse", +"Marie-Line", +"Marie-Lise", +"Marie-Lorraine", +"Marie-Lou", +"Marie-Lyne", +"Marie-Lyse", +"Marie-Naëlle", +"Marie-Odile", +"Marie-Pascale", +"Marie-Prudence", +"Marie-Prune", +"Marie-Rose", +"Marie-Sarah", +"Marie-Sophie", +"Marie-Valentine", +"Marie-Victoire", +"Marie-Yolande", +"Mary-Beth", +"Mary-Lynn", +"Mathilde-Marie", +"Meg-Anne", +"Nathalie-Anne", +"Paule-Émeline", +"Paule-Marie", +"Pauline-Hortense", +"Pauline-Marie", +"Pénélope-Fiona", +"Rose-Anne", +"Rose-Hélène", +"Sarah-Anne", +"Sarah-Eve", +"Sarah-Jane", +"Sarah-Laure", +"Sarah-Line", +"Sarah-Lise", +"Sarah-Lou", +"Sarah-Louise", +"Sarah-Marie", +"Sarah-Myriam", +"Sixtine-Jade", +"Sophie-Anne", +"Sophie-Caroline", +"Sylvie-Anne", +"Valérie-Anne", +"Alain-Maxime", +"Alain-Michel", +"Alain-Pierre", +"Ambroise-Polycarpe", +"André-Ferdinand", +"André-Jean", +"André-Marie", +"Ange-Marie", +"Antoine-Daniel", +"Antoine-Marie", +"Auguste-Eugène", +"Benoît-Joseph", +"Bernard-Marie", +"Camille-Raphaël", +"Carl-Éric", +"Carl-Edwin", +"Carl-Philippe", +"Charles-Aubin", +"Charles-Eric", +"Charles-Edouard", +"Charles-Étienne", +"Charles-Henri", +"Charles-Marie", +"Charles-Olivier", +"Charles-Orland", +"Christian-Jacques", +"Claude-Henri", +"Claude-Pierre", +"Côme-Edouard", +"David-Frédéric", +"David-Vincent", +"Don-Yves", +"Eric-Antoine", +"Etienne-Henri", +"Félix-Antoine", +"Félix-Marie", +"François-Alexandre", +"François-Charles", +"François-David", +"François-Éric", +"François-Ferdinand", +"François-Guillaume", +"François-Henri", +"François-Jérôme", +"François-Joseph", +"François-Julien", +"François-Louis", +"François-Marie", +"François-Nicolas", +"François-Pierre", +"François-Régis", +"François-René", +"François-Xavier", +"Frédéric-François", +"Gonzague-Edouard", +"Guy-Marie", +"Guy-Noël", +"Henri-Brice", +"Henri-Claude", +"Henri-Jean", +"Henri-Jules", +"Henri-Louis", +"Henri-Michel", +"Henri-Paul", +"Henri-Pierre", +"Henri-Xavier", +"Ian-Aël", +"Jacques-Alexandre", +"Jacques-Antoine", +"Jacques-Édouard", +"Jacques-Étienne", +"Jacques-Henri", +"Jacques-Olivier", +"Jacques-Pierre", +"Jacques-Yves", +"Jean-Adrien", +"Jean-Aimé", +"Jean-Alain", +"Jean-Albert", +"Jean-Alexandre", +"Jean-Alexis", +"Jean-Alfred", +"Jean-André", +"Jean-Antoine", +"Jean-Arnaud", +"Jean-Auguste", +"Jean-Baptiste", +"Jean-Barthélémy", +"Jean-Bastien", +"Jean-Benoît", +"Jean-Bernard", +"Jean-Bertrand", +"Jean-Blaise", +"Jean-Bosco", +"Jean-Briac", +"Jean-Brice", +"Jean-Bruno", +"Jean-Camille", +"Jean-Casimir", +"Jean-Cédric", +"Jean-Charles", +"Jean-Christian", +"Jean-Christophe", +"Jean-Clair", +"Jean-Claude", +"Jean-Clément", +"Jean-Côme", +"Jean-Cyril", +"Jean-Damien", +"Jean-Daniel", +"Jean-David", +"Jean-Denis", +"Jean-Didier", +"Jean-Dominique", +"Jean-Édouard", +"Jean-Élie", +"Jean-Éloi", +"Jean-Émile", +"Jean-Éric", +"Jean-Étienne", +"Jean-Eudes", +"Jean-Fabien", +"Jean-Francis", +"Jean-François", +"Jean-Gabriel", +"Jean-Gaël", +"Jean-Guy", +"Jean-Hugues", +"Jean-Jacques", +"Jean-Joseph", +"Jean-Julien", +"Jean-Kévin", +"Jean-Louis", +"Jean-Loup", +"Jean-Luc", +"Jean-Marc", +"Jean-Marcel", +"Jean-Marie", +"Jean-Matthieu", +"Jean-Maxime", +"Jean-Maurice", +"Jean-Michel", +"Jean-Nicolas", +"Jean-Noël", +"Jean-Pascal", +"Jean-Patrick", +"Jean-Paul", +"Jean-Philibert", +"Jean-Philippe", +"Jean-Pierre", +"Jean-René", +"Jean-Robert", +"Jean-Roch", +"Jean-Roland", +"Jean-Sébastien", +"Jean-Simon", +"Jean-Thomas", +"Jean-Vincent", +"Jean-Victor", +"Jean-Xavier", +"Jean-Yves", +"Jérôme-André", +"Joël-Francis", +"Joseph-Antoine", +"Joseph-Désiré", +"Joseph-Marie", +"Jules-Edouard", +"Jules-Henri", +"Julien-Pierre", +"Léo-Paul", +"Louis-André", +"Louis-Antoine", +"Louis-Arthur", +"Louis-Auguste", +"Louis-Benjamin", +"Louis-Benoît", +"Louis-Bernard", +"Louis-Casimir", +"Louis-Camille", +"Louis-Charles", +"Louis-Daniel", +"Louis-Ferdinand", +"Louis-Joseph", +"Louis-Marie", +"Louis-Mathieu", +"Louis-Philippe", +"Louis-Roger", +"Louis-Théophane", +"Louis-Valentin", +"Louis-Victor", +"Louis-Xavier", +"Loup-Léis", +"Luc-Henri", +"Marc-André", +"Marc-Antoine", +"Marc-Aurèle", +"Marc-Emmanuel", +"Marc-Olivier", +"Marie-Joseph", +"Michael-Corneille", +"Paul-Albert", +"Paul-Alexandre", +"Paul-André", +"Paul-Antoine", +"Paul-Armand", +"Paul-Arthur", +"Paul-Elie", +"Paul-Eloi", +"Paul-Emile", +"Paul-Étienne", +"Paul-Henri", +"Paul-Louis", +"Paul-Loup", +"Paul-Marie", +"Paul-Saintange", +"Paul-Vincent", +"Philippe-Alexandre", +"Philippe-Auguste", +"Pierre-Alexandre", +"Pierre-André", +"Pierre-Antoine", +"Pierre-Arnaud", +"Pierre-Baptiste", +"Pierre-Benoit", +"Pierre-Charles", +"Pierre-Côme", +"Pierre-Cyrille", +"Pierre-Edouard", +"Pierre-Elie", +"Pierre-Eloi", +"Pierre-Emmanuel", +"Pierre-Étienne", +"Pierre-Eugène", +"Pierre-François", +"Pierre-Henri", +"Pierre-Jean", +"Pierre-Jérôme", +"Pierre-Jules", +"Pierre-Julien", +"Pierre-Paul", +"Pierre-Quentin", +"Pierre-Valentin", +"Pierre-Vincent", +"Pierre-Xavier", +"Rémi-Etienne", +"René-Charles", +"René-Marc", +"René-Jean", +"René-Paul", +"René-Pierre", +"René-Yves", +"Thibaud-Marie", +"Vincent-Xavier", +"Xavier-Alexandre", +"Xavier-François", +"Xavier-Marie", +"Xavier-Pierre", +"Yann-Aël", +"Yann-Alrick", +"Yann-Éric", +"Yann-Gaël", +"Yann-Yves", +"Yann-Vari", +"Yves-Alain", +"Yves-Alexandre", +"Yves-André", +"Yves-Éric", +"Yves-Henri", +"Yves-Laurent", +"Yves-Marie", +"Yves-Michel", +"Yves-Olivier", +"Yves-Pierre" ]