2011-05-01 21:50:50 +04:00
|
|
|
|
<?php
|
2011-07-08 16:52:33 +04:00
|
|
|
|
|
2011-07-06 15:08:04 +04:00
|
|
|
|
/**
|
2011-05-01 21:50:50 +04:00
|
|
|
|
* @license Dual licensed under the MIT or GPL Version 2 licenses.
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* @package NameCaseLib
|
|
|
|
|
*/
|
|
|
|
|
/**
|
2011-05-01 21:50:50 +04:00
|
|
|
|
*
|
|
|
|
|
*/
|
2011-07-05 17:01:19 +04:00
|
|
|
|
require_once dirname(__FILE__) . '/NCL/NCLNameCaseCore.php';
|
2011-05-01 21:50:50 +04:00
|
|
|
|
|
2011-07-06 15:08:04 +04:00
|
|
|
|
/**
|
|
|
|
|
* <b>NCL NameCase Russian Language</b>
|
|
|
|
|
*
|
|
|
|
|
* Русские правила склонения ФИО
|
|
|
|
|
* Правила определения пола человека по ФИО для русского языка
|
|
|
|
|
* Система разделения фамилий имен и отчеств для русского языка
|
|
|
|
|
*
|
|
|
|
|
* @author Андрей Чайка <bymer3@gmail.com>
|
2011-07-11 21:56:11 +04:00
|
|
|
|
* @version 0.4.1
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* @package NameCaseLib
|
|
|
|
|
*/
|
2011-07-08 16:52:33 +04:00
|
|
|
|
class NCLNameCaseRu extends NCLNameCaseCore
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-20 22:12:17 +04:00
|
|
|
|
|
2011-07-10 16:21:23 +04:00
|
|
|
|
/**
|
|
|
|
|
* Версия языкового файла
|
|
|
|
|
* @var string
|
|
|
|
|
*/
|
2011-07-27 16:08:09 +04:00
|
|
|
|
protected $languageBuild = '11072716';
|
2011-07-06 15:08:04 +04:00
|
|
|
|
/**
|
|
|
|
|
* Количество падежей в языке
|
|
|
|
|
* @var int
|
2011-05-01 21:50:50 +04:00
|
|
|
|
*/
|
2011-06-28 12:51:03 +04:00
|
|
|
|
protected $CaseCount = 6;
|
2011-07-06 15:08:04 +04:00
|
|
|
|
/**
|
|
|
|
|
* Список гласных русского языка
|
|
|
|
|
* @var string
|
2011-05-01 21:50:50 +04:00
|
|
|
|
*/
|
|
|
|
|
private $vowels = "аеёиоуыэюя";
|
2011-07-06 15:08:04 +04:00
|
|
|
|
/**
|
|
|
|
|
* Список согласных русского языка
|
|
|
|
|
* @var string
|
2011-05-01 21:50:50 +04:00
|
|
|
|
*/
|
|
|
|
|
private $consonant = "бвгджзйклмнпрстфхцчшщ";
|
2011-07-06 15:08:04 +04:00
|
|
|
|
/**
|
|
|
|
|
* Окончания имен/фамилий, который не склоняются
|
|
|
|
|
* @var array
|
2011-05-01 21:50:50 +04:00
|
|
|
|
*/
|
|
|
|
|
private $ovo = array('ово', 'аго', 'яго', 'ирь');
|
2011-07-06 15:08:04 +04:00
|
|
|
|
/**
|
|
|
|
|
* Окончания имен/фамилий, который не склоняются
|
|
|
|
|
* @var array
|
2011-05-01 21:50:50 +04:00
|
|
|
|
*/
|
2015-07-24 12:05:06 +03:00
|
|
|
|
private $ih = array('их', 'ых', 'ко', 'уа'/*Бенуа, Франсуа*/);
|
2011-07-27 16:03:14 +04:00
|
|
|
|
/**
|
|
|
|
|
* Список окончаний характерных для фамилий
|
|
|
|
|
* По шаблону {letter}* где * любой символ кроме тех, что в {exclude}
|
|
|
|
|
* @var array of {letter}=>{exclude}
|
|
|
|
|
*/
|
|
|
|
|
private $splitSecondExclude = array(
|
|
|
|
|
'а' => 'взйкмнпрстфя',
|
|
|
|
|
'б' => 'а',
|
|
|
|
|
'в' => 'аь',
|
|
|
|
|
'г' => 'а',
|
|
|
|
|
'д' => 'ар',
|
2011-07-27 16:10:16 +04:00
|
|
|
|
'е' => 'бвгдйлмня',
|
|
|
|
|
'ё' => 'бвгдйлмня',
|
2011-07-27 16:03:14 +04:00
|
|
|
|
'ж' => '',
|
|
|
|
|
'з' => 'а',
|
|
|
|
|
'и' => 'гдйклмнопрсфя',
|
|
|
|
|
'й' => 'ля',
|
|
|
|
|
'к' => 'аст',
|
|
|
|
|
'л' => 'аилоья',
|
|
|
|
|
'м' => 'аип',
|
|
|
|
|
'н' => 'ат',
|
2011-09-24 22:35:43 +04:00
|
|
|
|
'о' => 'вдлнпря',
|
2011-07-27 16:03:14 +04:00
|
|
|
|
'п' => 'п',
|
|
|
|
|
'р' => 'адикпть',
|
|
|
|
|
'с' => 'атуя',
|
|
|
|
|
'т' => 'аор',
|
|
|
|
|
'у' => 'дмр',
|
|
|
|
|
'ф' => 'аь',
|
|
|
|
|
'х' => 'а',
|
|
|
|
|
'ц' => 'а',
|
|
|
|
|
'ч' => '',
|
|
|
|
|
'ш' => 'а',
|
|
|
|
|
'щ' => '',
|
|
|
|
|
'ъ' => '',
|
|
|
|
|
'ы' => 'дн',
|
|
|
|
|
'ь' => 'я',
|
|
|
|
|
'э' => '',
|
|
|
|
|
'ю' => '',
|
|
|
|
|
'я' => 'нс'
|
|
|
|
|
);
|
2011-05-01 21:50:50 +04:00
|
|
|
|
|
2015-11-03 11:19:00 +03:00
|
|
|
|
private $names_man=array('Вова', 'Анри', 'Питер', 'Пауль', 'Франц', 'Вильям', 'Уильям',
|
|
|
|
|
'Альфонс', 'Ганс', 'Франс', 'Филиппо', 'Андреа', 'Корнелис', 'Фрэнк', 'Леонардо',
|
|
|
|
|
'Джеймс', 'Отто', 'жан-пьер', 'Джованни', 'Джозеф', 'Педро', 'Адольф', 'Уолтер',
|
|
|
|
|
'Антонио', 'Якоб', 'Эсташ', 'Адрианс', 'Франческо', 'Доменико', 'Ханс', 'Гун',
|
|
|
|
|
'Шарль', 'Хендрик', 'Амброзиус', 'Таддео', 'Фердинанд', 'Джошуа', 'Изак', 'Иоганн',
|
|
|
|
|
'Фридрих', 'Эмиль', 'Умберто', 'Франсуа', 'Ян', 'Эрнст', 'Георг', 'Карл'
|
|
|
|
|
);
|
|
|
|
|
|
2011-07-05 23:24:01 +04:00
|
|
|
|
/**
|
|
|
|
|
* Мужские имена, оканчивающиеся на любой ь и -й,
|
|
|
|
|
* склоняются так же, как обычные существительные мужского рода
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* @return bool true если правило было задействовано и false если нет.
|
2011-05-01 21:50:50 +04:00
|
|
|
|
*/
|
2011-07-05 23:24:01 +04:00
|
|
|
|
protected function manRule1()
|
|
|
|
|
{
|
|
|
|
|
if ($this->in($this->Last(1), 'ьй'))
|
|
|
|
|
{
|
2015-07-28 16:22:31 +03:00
|
|
|
|
if ($this->inNames($this->workingWord, array('Дель')))
|
|
|
|
|
{
|
|
|
|
|
$this->Rule(101);
|
|
|
|
|
$this->makeResultTheSame();
|
|
|
|
|
return true;
|
|
|
|
|
}
|
|
|
|
|
|
2011-07-05 23:24:01 +04:00
|
|
|
|
if ($this->Last(2, 1) != "и")
|
|
|
|
|
{
|
|
|
|
|
$this->wordForms($this->workingWord, array('я', 'ю', 'я', 'ем', 'е'), 1);
|
2015-07-28 16:35:24 +03:00
|
|
|
|
$this->Rule(102);
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return true;
|
|
|
|
|
}
|
|
|
|
|
else
|
|
|
|
|
{
|
|
|
|
|
$this->wordForms($this->workingWord, array('я', 'ю', 'я', 'ем', 'и'), 1);
|
2015-07-28 16:35:24 +03:00
|
|
|
|
$this->Rule(103);
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return true;
|
|
|
|
|
}
|
|
|
|
|
}
|
|
|
|
|
return false;
|
|
|
|
|
}
|
2011-05-01 21:50:50 +04:00
|
|
|
|
|
2011-07-05 23:24:01 +04:00
|
|
|
|
/**
|
|
|
|
|
* Мужские имена, оканчивающиеся на любой твердый согласный,
|
|
|
|
|
* склоняются так же, как обычные существительные мужского рода
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* @return bool true если правило было задействовано и false если нет.
|
2011-07-05 23:24:01 +04:00
|
|
|
|
*/
|
|
|
|
|
protected function manRule2()
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
if ($this->in($this->Last(1), $this->consonant))
|
|
|
|
|
{
|
|
|
|
|
if ($this->inNames($this->workingWord, "Павел"))
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->lastResult = array("Павел", "Павла", "Павлу", "Павла", "Павлом", "Павле");
|
|
|
|
|
$this->Rule(201);
|
|
|
|
|
return true;
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
2011-07-05 23:24:01 +04:00
|
|
|
|
elseif ($this->inNames($this->workingWord, "Лев"))
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->lastResult = array("Лев", "Льва", "Льву", "Льва", "Львом", "Льве");
|
|
|
|
|
$this->Rule(202);
|
|
|
|
|
return true;
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
2015-07-24 12:05:06 +03:00
|
|
|
|
elseif ($this->inNames($this->workingWord, 'ван'))
|
2015-07-23 19:19:51 +03:00
|
|
|
|
{
|
|
|
|
|
$this->Rule(203);
|
|
|
|
|
$this->makeResultTheSame();
|
|
|
|
|
return true;
|
|
|
|
|
}
|
2011-07-05 23:24:01 +04:00
|
|
|
|
else
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->wordForms($this->workingWord, array('а', 'у', 'а', 'ом', 'е'));
|
2015-07-23 19:19:51 +03:00
|
|
|
|
$this->Rule(204);
|
2011-05-01 21:50:50 +04:00
|
|
|
|
return true;
|
|
|
|
|
}
|
|
|
|
|
}
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return false;
|
|
|
|
|
}
|
2011-05-01 21:50:50 +04:00
|
|
|
|
|
2011-07-05 23:24:01 +04:00
|
|
|
|
/**
|
|
|
|
|
* Мужские и женские имена, оканчивающиеся на -а, склоняются, как и любые
|
|
|
|
|
* существительные с таким же окончанием
|
|
|
|
|
* Мужские и женские имена, оканчивающиеся иа -я, -ья, -ия, -ея, независимо от языка,
|
|
|
|
|
* из которого они происходят, склоняются как существительные с соответствующими окончаниями
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* @return bool true если правило было задействовано и false если нет.
|
2011-07-05 23:24:01 +04:00
|
|
|
|
*/
|
|
|
|
|
protected function manRule3()
|
|
|
|
|
{
|
|
|
|
|
if ($this->Last(1) == "а")
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2015-12-08 16:45:57 +03:00
|
|
|
|
if ($this->inNames($this->workingWord, array('фра', 'Дега', 'Андреа', 'Сёра', 'Сера')))
|
2011-07-05 23:24:01 +04:00
|
|
|
|
{
|
|
|
|
|
$this->Rule(301);
|
2015-07-24 12:05:06 +03:00
|
|
|
|
$this->makeResultTheSame();
|
|
|
|
|
return true;
|
|
|
|
|
}
|
|
|
|
|
elseif (!$this->in($this->Last(2, 1), 'кшгх'))
|
|
|
|
|
{
|
|
|
|
|
$this->wordForms($this->workingWord, array('ы', 'е', 'у', 'ой', 'е'), 1);
|
|
|
|
|
$this->Rule(302);
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return true;
|
|
|
|
|
}
|
|
|
|
|
else
|
|
|
|
|
{
|
|
|
|
|
$this->wordForms($this->workingWord, array('и', 'е', 'у', 'ой', 'е'), 1);
|
2015-07-24 12:05:06 +03:00
|
|
|
|
$this->Rule(303);
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return true;
|
|
|
|
|
}
|
|
|
|
|
}
|
|
|
|
|
elseif ($this->Last(1) == "я")
|
|
|
|
|
{
|
|
|
|
|
$this->wordForms($this->workingWord, array('и', 'е', 'ю', 'ей', 'е'), 1);
|
|
|
|
|
$this->Rule(303);
|
|
|
|
|
return true;
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return false;
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
|
|
|
|
|
2011-07-05 23:24:01 +04:00
|
|
|
|
/**
|
|
|
|
|
* Мужские фамилии, оканчивающиеся на -ь -й, склоняются так же,
|
|
|
|
|
* как обычные существительные мужского рода
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* @return bool true если правило было задействовано и false если нет.
|
2011-05-01 21:50:50 +04:00
|
|
|
|
*/
|
2011-07-05 23:24:01 +04:00
|
|
|
|
protected function manRule4()
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
if ($this->in($this->Last(1), 'ьй'))
|
|
|
|
|
{
|
|
|
|
|
|
2011-07-27 16:03:14 +04:00
|
|
|
|
//Слова типа Воробей
|
2011-07-20 22:12:17 +04:00
|
|
|
|
if ($this->Last(3) == 'бей')
|
2011-07-11 21:50:01 +04:00
|
|
|
|
{
|
|
|
|
|
$this->wordForms($this->workingWord, array('ья', 'ью', 'ья', 'ьем', 'ье'), 2);
|
|
|
|
|
$this->Rule(400);
|
|
|
|
|
return true;
|
|
|
|
|
}
|
2011-07-20 22:27:57 +04:00
|
|
|
|
elseif ($this->Last(3, 1) == 'а' or $this->in($this->Last(2, 1), 'ел'))
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->wordForms($this->workingWord, array('я', 'ю', 'я', 'ем', 'е'), 1);
|
|
|
|
|
$this->Rule(401);
|
|
|
|
|
return true;
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
2011-07-27 16:03:14 +04:00
|
|
|
|
//Толстой -» ТолстЫм
|
2011-07-05 23:24:01 +04:00
|
|
|
|
elseif ($this->Last(2, 1) == 'ы' or $this->Last(3, 1) == 'т')
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->wordForms($this->workingWord, array('ого', 'ому', 'ого', 'ым', 'ом'), 2);
|
|
|
|
|
$this->Rule(402);
|
|
|
|
|
return true;
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
2011-07-27 16:03:14 +04:00
|
|
|
|
//Лесничий
|
2011-07-05 23:24:01 +04:00
|
|
|
|
elseif ($this->Last(3) == 'чий')
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->wordForms($this->workingWord, array('ьего', 'ьему', 'ьего', 'ьим', 'ьем'), 2);
|
|
|
|
|
$this->Rule(403);
|
|
|
|
|
return true;
|
|
|
|
|
}
|
2011-07-27 16:58:34 +04:00
|
|
|
|
elseif (!$this->in($this->Last(2, 1), $this->vowels) or $this->Last(2, 1) == 'и')
|
2011-07-05 23:24:01 +04:00
|
|
|
|
{
|
|
|
|
|
$this->wordForms($this->workingWord, array('ого', 'ому', 'ого', 'им', 'ом'), 2);
|
|
|
|
|
$this->Rule(404);
|
2011-05-01 21:50:50 +04:00
|
|
|
|
return true;
|
|
|
|
|
}
|
2011-07-27 16:53:00 +04:00
|
|
|
|
else
|
|
|
|
|
{
|
|
|
|
|
$this->makeResultTheSame();
|
|
|
|
|
$this->Rule(405);
|
|
|
|
|
return true;
|
|
|
|
|
}
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return false;
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
|
|
|
|
|
2011-07-05 23:24:01 +04:00
|
|
|
|
/**
|
|
|
|
|
* Мужские фамилии, оканчивающиеся на -к
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* @return bool true если правило было задействовано и false если нет.
|
2011-05-01 21:50:50 +04:00
|
|
|
|
*/
|
2011-07-05 23:24:01 +04:00
|
|
|
|
protected function manRule5()
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
if ($this->Last(1) == 'к')
|
|
|
|
|
{
|
2011-07-27 16:03:14 +04:00
|
|
|
|
//Если перед слово на ок, то нужно убрать о
|
2015-09-15 14:51:55 +03:00
|
|
|
|
if ($this->Last(4)=='енок' || $this->Last(4)=='ёнок')//Поллок
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->wordForms($this->workingWord, array('ка', 'ку', 'ка', 'ком', 'ке'), 2);
|
|
|
|
|
$this->Rule(501);
|
|
|
|
|
return true;
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
2015-08-26 14:38:28 +03:00
|
|
|
|
if ($this->Last(2, 1) == 'е' && !in_array($this->Last(3, 1), array('р')))//Лотрек
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->wordForms($this->workingWord, array('ька', 'ьку', 'ька', 'ьком', 'ьке'), 2);
|
|
|
|
|
$this->Rule(502);
|
|
|
|
|
return true;
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
2011-07-05 23:24:01 +04:00
|
|
|
|
else
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->wordForms($this->workingWord, array('а', 'у', 'а', 'ом', 'е'));
|
|
|
|
|
$this->Rule(503);
|
2011-05-01 21:50:50 +04:00
|
|
|
|
return true;
|
|
|
|
|
}
|
|
|
|
|
}
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return false;
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
/**
|
|
|
|
|
* Мужские фамили на согласный выбираем ем/ом/ым
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* @return bool true если правило было задействовано и false если нет.
|
2011-07-05 23:24:01 +04:00
|
|
|
|
*/
|
|
|
|
|
protected function manRule6()
|
|
|
|
|
{
|
|
|
|
|
if ($this->Last(1) == 'ч')
|
|
|
|
|
{
|
|
|
|
|
$this->wordForms($this->workingWord, array('а', 'у', 'а', 'ем', 'е'));
|
|
|
|
|
$this->Rule(601);
|
|
|
|
|
return true;
|
|
|
|
|
}
|
2011-07-27 16:03:14 +04:00
|
|
|
|
//е перед ц выпадает
|
2011-07-20 22:12:17 +04:00
|
|
|
|
elseif ($this->Last(2) == 'ец')
|
2011-07-11 22:23:49 +04:00
|
|
|
|
{
|
|
|
|
|
$this->wordForms($this->workingWord, array('ца', 'цу', 'ца', 'цом', 'це'), 2);
|
|
|
|
|
$this->Rule(604);
|
|
|
|
|
return true;
|
|
|
|
|
}
|
2011-07-27 16:40:37 +04:00
|
|
|
|
elseif ($this->in($this->Last(1), 'цсршмхт'))
|
2011-07-05 23:24:01 +04:00
|
|
|
|
{
|
|
|
|
|
$this->wordForms($this->workingWord, array('а', 'у', 'а', 'ом', 'е'));
|
|
|
|
|
$this->Rule(602);
|
|
|
|
|
return true;
|
|
|
|
|
}
|
|
|
|
|
elseif ($this->in($this->Last(1), $this->consonant))
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->wordForms($this->workingWord, array('а', 'у', 'а', 'ым', 'е'));
|
|
|
|
|
$this->Rule(603);
|
|
|
|
|
return true;
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return false;
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
|
|
|
|
|
2011-07-05 23:24:01 +04:00
|
|
|
|
/**
|
|
|
|
|
* Мужские фамили на -а -я
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* @return bool true если правило было задействовано и false если нет.
|
2011-05-01 21:50:50 +04:00
|
|
|
|
*/
|
2011-07-05 23:24:01 +04:00
|
|
|
|
protected function manRule7()
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
if ($this->Last(1) == "а")
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2015-09-21 13:00:37 +03:00
|
|
|
|
if ($this->inNames($this->workingWord, array('да')))
|
|
|
|
|
{
|
|
|
|
|
$this->Rule(701);
|
|
|
|
|
$this->makeResultTheSame();
|
|
|
|
|
return true;
|
|
|
|
|
}
|
2011-07-27 16:03:14 +04:00
|
|
|
|
//Если основа на ш, то нужно и, ей
|
2011-07-05 23:24:01 +04:00
|
|
|
|
if ($this->Last(2, 1) == 'ш')
|
|
|
|
|
{
|
|
|
|
|
$this->wordForms($this->workingWord, array('и', 'е', 'у', 'ей', 'е'), 1);
|
2015-09-21 13:00:37 +03:00
|
|
|
|
$this->Rule(702);
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return true;
|
|
|
|
|
}
|
2011-07-14 12:46:28 +04:00
|
|
|
|
elseif ($this->in($this->Last(2, 1), 'хкг'))
|
2011-07-05 23:24:01 +04:00
|
|
|
|
{
|
|
|
|
|
$this->wordForms($this->workingWord, array('и', 'е', 'у', 'ой', 'е'), 1);
|
2015-09-21 13:00:37 +03:00
|
|
|
|
$this->Rule(703);
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return true;
|
|
|
|
|
}
|
|
|
|
|
else
|
|
|
|
|
{
|
|
|
|
|
$this->wordForms($this->workingWord, array('ы', 'е', 'у', 'ой', 'е'), 1);
|
2015-09-21 13:00:37 +03:00
|
|
|
|
$this->Rule(704);
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return true;
|
|
|
|
|
}
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
2011-07-05 23:24:01 +04:00
|
|
|
|
elseif ($this->Last(1) == "я")
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->wordForms($this->workingWord, array('ой', 'ой', 'ую', 'ой', 'ой'), 2);
|
2015-09-21 13:00:37 +03:00
|
|
|
|
$this->Rule(705);
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return true;
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return false;
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
/**
|
|
|
|
|
* Не склоняются мужский фамилии
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* @return bool true если правило было задействовано и false если нет.
|
2011-07-05 23:24:01 +04:00
|
|
|
|
*/
|
|
|
|
|
protected function manRule8()
|
|
|
|
|
{
|
2015-10-20 11:59:34 +03:00
|
|
|
|
if ($this->in($this->Last(3), $this->ovo) || $this->in($this->Last(2), $this->ih))
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2015-10-20 11:59:34 +03:00
|
|
|
|
if ( $this->inNames($this->workingWord, array('рерих')) ) return false;
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->Rule(8);
|
2011-07-27 16:53:00 +04:00
|
|
|
|
$this->makeResultTheSame();
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return true;
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return false;
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
/**
|
|
|
|
|
* Мужские и женские имена, оканчивающиеся на -а, склоняются,
|
|
|
|
|
* как и любые существительные с таким же окончанием
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* @return bool true если правило было задействовано и false если нет.
|
2011-07-05 23:24:01 +04:00
|
|
|
|
*/
|
|
|
|
|
protected function womanRule1()
|
|
|
|
|
{
|
2011-07-20 22:12:17 +04:00
|
|
|
|
if ($this->Last(1) == "а" and $this->Last(2, 1) != 'и')
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
if (!$this->in($this->Last(2, 1), 'шхкг'))
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->wordForms($this->workingWord, array('ы', 'е', 'у', 'ой', 'е'), 1);
|
|
|
|
|
$this->Rule(101);
|
|
|
|
|
return true;
|
|
|
|
|
}
|
|
|
|
|
else
|
|
|
|
|
{
|
2011-07-27 16:03:14 +04:00
|
|
|
|
//ей посля шиплячего
|
2011-07-05 23:24:01 +04:00
|
|
|
|
if ($this->Last(2, 1) == 'ш')
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->wordForms($this->workingWord, array('и', 'е', 'у', 'ей', 'е'), 1);
|
|
|
|
|
$this->Rule(102);
|
2011-05-01 21:50:50 +04:00
|
|
|
|
return true;
|
|
|
|
|
}
|
|
|
|
|
else
|
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->wordForms($this->workingWord, array('и', 'е', 'у', 'ой', 'е'), 1);
|
|
|
|
|
$this->Rule(103);
|
2011-05-01 21:50:50 +04:00
|
|
|
|
return true;
|
|
|
|
|
}
|
|
|
|
|
}
|
2011-07-05 23:24:01 +04:00
|
|
|
|
}
|
|
|
|
|
return false;
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
/**
|
|
|
|
|
* Мужские и женские имена, оканчивающиеся иа -я, -ья, -ия, -ея, независимо от языка,
|
|
|
|
|
* из которого они происходят, склоняются как существительные с соответствующими окончаниями
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* @return bool true если правило было задействовано и false если нет.
|
2011-07-05 23:24:01 +04:00
|
|
|
|
*/
|
|
|
|
|
protected function womanRule2()
|
|
|
|
|
{
|
|
|
|
|
if ($this->Last(1) == "я")
|
|
|
|
|
{
|
|
|
|
|
if ($this->Last(2, 1) <> "и")
|
|
|
|
|
{
|
|
|
|
|
$this->wordForms($this->workingWord, array('и', 'е', 'ю', 'ей', 'е'), 1);
|
|
|
|
|
$this->Rule(201);
|
|
|
|
|
return true;
|
|
|
|
|
}
|
|
|
|
|
else
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->wordForms($this->workingWord, array('и', 'и', 'ю', 'ей', 'и'), 1);
|
|
|
|
|
$this->Rule(202);
|
2011-05-01 21:50:50 +04:00
|
|
|
|
return true;
|
|
|
|
|
}
|
|
|
|
|
}
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return false;
|
|
|
|
|
}
|
2011-05-01 21:50:50 +04:00
|
|
|
|
|
2011-07-05 23:24:01 +04:00
|
|
|
|
/**
|
|
|
|
|
* Русские женские имена, оканчивающиеся на мягкий согласный, склоняются,
|
|
|
|
|
* как существительные женского рода типа дочь, тень
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* @return bool true если правило было задействовано и false если нет.
|
2011-07-05 23:24:01 +04:00
|
|
|
|
*/
|
|
|
|
|
protected function womanRule3()
|
|
|
|
|
{
|
|
|
|
|
if ($this->Last(1) == "ь")
|
|
|
|
|
{
|
|
|
|
|
$this->wordForms($this->workingWord, array('и', 'и', 'ь', 'ью', 'и'), 1);
|
|
|
|
|
$this->Rule(3);
|
|
|
|
|
return true;
|
|
|
|
|
}
|
|
|
|
|
return false;
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
/**
|
|
|
|
|
* Женские фамилия, оканчивающиеся на -а -я, склоняются,
|
|
|
|
|
* как и любые существительные с таким же окончанием
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* @return bool true если правило было задействовано и false если нет.
|
2011-07-05 23:24:01 +04:00
|
|
|
|
*/
|
|
|
|
|
protected function womanRule4()
|
|
|
|
|
{
|
|
|
|
|
|
|
|
|
|
if ($this->Last(1) == "а")
|
|
|
|
|
{
|
|
|
|
|
if ($this->in($this->Last(2, 1), 'гк'))
|
|
|
|
|
{
|
|
|
|
|
$this->wordForms($this->workingWord, array('и', 'е', 'у', 'ой', 'е'), 1);
|
|
|
|
|
$this->Rule(401);
|
|
|
|
|
return true;
|
|
|
|
|
}
|
|
|
|
|
elseif ($this->in($this->Last(2, 1), 'ш'))
|
|
|
|
|
{
|
|
|
|
|
$this->wordForms($this->workingWord, array('и', 'е', 'у', 'ей', 'е'), 1);
|
|
|
|
|
$this->Rule(402);
|
|
|
|
|
return true;
|
|
|
|
|
}
|
|
|
|
|
else
|
|
|
|
|
{
|
|
|
|
|
$this->wordForms($this->workingWord, array('ой', 'ой', 'у', 'ой', 'ой'), 1);
|
|
|
|
|
$this->Rule(403);
|
|
|
|
|
return true;
|
|
|
|
|
}
|
|
|
|
|
}
|
|
|
|
|
elseif ($this->Last(1) == "я")
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->wordForms($this->workingWord, array('ой', 'ой', 'ую', 'ой', 'ой'), 2);
|
|
|
|
|
$this->Rule(404);
|
|
|
|
|
return true;
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return false;
|
|
|
|
|
}
|
|
|
|
|
|
2011-07-06 15:08:04 +04:00
|
|
|
|
/**
|
2011-07-12 19:59:05 +04:00
|
|
|
|
* Функция пытается применить цепочку правил для мужских имен
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* @return boolean true - если было использовано правило из списка, false - если правило не было найденым
|
2011-07-05 23:24:01 +04:00
|
|
|
|
*/
|
|
|
|
|
protected function manFirstName()
|
|
|
|
|
{
|
2015-07-23 19:19:51 +03:00
|
|
|
|
if ($this->inNames($this->workingWord, array('Старший', 'Младший')))
|
|
|
|
|
{
|
|
|
|
|
$this->wordForms($this->workingWord, array('его', 'ему', 'его', 'им', 'ем'), 2);
|
|
|
|
|
return true;
|
|
|
|
|
}
|
2015-07-24 12:05:06 +03:00
|
|
|
|
if ($this->inNames($this->workingWord, array('Мариа')))
|
|
|
|
|
{
|
|
|
|
|
//Альфонс Мария Муха
|
|
|
|
|
$this->wordForms($this->workingWord, array('и', 'и', 'ю', 'ей', 'ии'), 1);
|
|
|
|
|
return true;
|
|
|
|
|
}
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return $this->RulesChain('man', array(1, 2, 3));
|
|
|
|
|
}
|
|
|
|
|
|
2011-07-06 15:08:04 +04:00
|
|
|
|
/**
|
2011-07-12 19:59:05 +04:00
|
|
|
|
* Функция пытается применить цепочку правил для женских имен
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* @return boolean true - если было использовано правило из списка, false - если правило не было найденым
|
2011-07-05 23:24:01 +04:00
|
|
|
|
*/
|
|
|
|
|
protected function womanFirstName()
|
|
|
|
|
{
|
|
|
|
|
return $this->RulesChain('woman', array(1, 2, 3));
|
|
|
|
|
}
|
|
|
|
|
|
2011-07-06 15:08:04 +04:00
|
|
|
|
/**
|
2011-07-12 19:59:05 +04:00
|
|
|
|
* Функция пытается применить цепочку правил для мужских фамилий
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* @return boolean true - если было использовано правило из списка, false - если правило не было найденым
|
2011-07-05 23:24:01 +04:00
|
|
|
|
*/
|
|
|
|
|
protected function manSecondName()
|
|
|
|
|
{
|
|
|
|
|
return $this->RulesChain('man', array(8, 4, 5, 6, 7));
|
|
|
|
|
}
|
|
|
|
|
|
2011-07-06 15:08:04 +04:00
|
|
|
|
/**
|
2011-07-12 19:59:05 +04:00
|
|
|
|
* Функция пытается применить цепочку правил для женских фамилий
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* @return boolean true - если было использовано правило из списка, false - если правило не было найденым
|
2011-07-05 23:24:01 +04:00
|
|
|
|
*/
|
|
|
|
|
protected function womanSecondName()
|
|
|
|
|
{
|
|
|
|
|
return $this->RulesChain('woman', array(4));
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
|
|
|
|
|
2011-07-06 15:08:04 +04:00
|
|
|
|
/**
|
2015-07-24 12:05:06 +03:00
|
|
|
|
* Функция склоняет мужские отчества
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* @return boolean true - если слово было успешно изменено, false - если не получилось этого сделать
|
2011-05-01 21:50:50 +04:00
|
|
|
|
*/
|
2011-06-28 12:51:03 +04:00
|
|
|
|
protected function manFatherName()
|
2015-09-21 13:10:10 +03:00
|
|
|
|
{
|
2011-07-27 16:03:14 +04:00
|
|
|
|
//Проверяем действительно ли отчество
|
2011-07-05 23:24:01 +04:00
|
|
|
|
if ($this->inNames($this->workingWord, 'Ильич'))
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->wordForms($this->workingWord, array('а', 'у', 'а', 'ом', 'е'));
|
2011-05-01 21:50:50 +04:00
|
|
|
|
return true;
|
|
|
|
|
}
|
2011-07-05 23:24:01 +04:00
|
|
|
|
elseif ($this->Last(2) == 'ич')
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->wordForms($this->workingWord, array('а', 'у', 'а', 'ем', 'е'));
|
2011-05-01 21:50:50 +04:00
|
|
|
|
return true;
|
|
|
|
|
}
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return false;
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
|
|
|
|
|
2011-07-06 15:08:04 +04:00
|
|
|
|
/**
|
|
|
|
|
* Функция склоняет женские отчества
|
|
|
|
|
* @return boolean true - если слово было успешно изменено, false - если не получилось этого сделать
|
2011-05-01 21:50:50 +04:00
|
|
|
|
*/
|
2011-06-28 12:51:03 +04:00
|
|
|
|
protected function womanFatherName()
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-27 16:03:14 +04:00
|
|
|
|
//Проверяем действительно ли отчество
|
2011-07-05 23:24:01 +04:00
|
|
|
|
if ($this->Last(2) == 'на')
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->wordForms($this->workingWord, array('ы', 'е', 'у', 'ой', 'е'), 1);
|
2011-05-01 21:50:50 +04:00
|
|
|
|
return true;
|
|
|
|
|
}
|
2011-07-05 23:24:01 +04:00
|
|
|
|
return false;
|
|
|
|
|
}
|
2011-07-08 16:52:33 +04:00
|
|
|
|
|
2011-07-06 15:08:04 +04:00
|
|
|
|
/**
|
|
|
|
|
* Определение пола по правилам имен
|
|
|
|
|
* @param NCLNameCaseWord $word обьект класса слов, для которого нужно определить пол
|
|
|
|
|
*/
|
2011-07-05 23:24:01 +04:00
|
|
|
|
protected function GenderByFirstName(NCLNameCaseWord $word)
|
|
|
|
|
{
|
|
|
|
|
$this->setWorkingWord($word->getWord());
|
|
|
|
|
|
|
|
|
|
$man = 0; //Мужчина
|
|
|
|
|
$woman = 0; //Женщина
|
2011-09-24 22:35:43 +04:00
|
|
|
|
//Попробуем выжать максимум из имени
|
|
|
|
|
//Если имя заканчивается на й, то скорее всего мужчина
|
2011-07-05 23:24:01 +04:00
|
|
|
|
if ($this->Last(1) == 'й')
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$man+=0.9;
|
|
|
|
|
}
|
2015-11-03 11:19:00 +03:00
|
|
|
|
if ($this->in($this->Last(2), array('он', 'ов', 'ав', 'ам', 'ол', 'ан', 'рд', 'мп', 'по'/*Филиппо*/, 'до'/*Леонардо*/, 'др', 'рт')))
|
2011-07-05 23:24:01 +04:00
|
|
|
|
{
|
|
|
|
|
$man+=0.3;
|
|
|
|
|
}
|
|
|
|
|
if ($this->in($this->Last(1), $this->consonant))
|
|
|
|
|
{
|
|
|
|
|
$man+=0.01;
|
|
|
|
|
}
|
|
|
|
|
if ($this->Last(1) == 'ь')
|
|
|
|
|
{
|
|
|
|
|
$man+=0.02;
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
|
|
|
|
|
2015-09-23 11:19:34 +03:00
|
|
|
|
if ($this->in($this->Last(2), array('вь', 'фь', 'ль', 'на')))
|
2011-07-05 23:24:01 +04:00
|
|
|
|
{
|
|
|
|
|
$woman+=0.1;
|
|
|
|
|
}
|
2011-05-01 21:50:50 +04:00
|
|
|
|
|
2011-07-05 23:24:01 +04:00
|
|
|
|
if ($this->in($this->Last(2), array('ла')))
|
2011-05-01 21:50:50 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$woman+=0.04;
|
|
|
|
|
}
|
2011-05-05 11:06:35 +04:00
|
|
|
|
|
2011-07-05 23:24:01 +04:00
|
|
|
|
if ($this->in($this->Last(2), array('то', 'ма')))
|
|
|
|
|
{
|
|
|
|
|
$man+=0.01;
|
|
|
|
|
}
|
2011-05-05 11:06:35 +04:00
|
|
|
|
|
2015-07-28 16:35:24 +03:00
|
|
|
|
if ($this->in($this->Last(3), array('лья', 'вва', 'ока', 'ука', 'ита', 'эль'/*Рафаэль, Габриэль*/, 'реа'/*Андреа*/)))
|
2011-07-05 23:24:01 +04:00
|
|
|
|
{
|
|
|
|
|
$man+=0.2;
|
|
|
|
|
}
|
2011-05-05 11:06:35 +04:00
|
|
|
|
|
2011-07-05 23:24:01 +04:00
|
|
|
|
if ($this->in($this->Last(3), array('има')))
|
|
|
|
|
{
|
|
|
|
|
$woman+=0.15;
|
|
|
|
|
}
|
2011-05-05 11:06:35 +04:00
|
|
|
|
|
2015-07-24 12:05:06 +03:00
|
|
|
|
if ($this->in($this->Last(3), array('лия', 'ния', 'сия', 'дра', 'лла', 'кла', 'опа', 'вия')))
|
2011-07-05 23:24:01 +04:00
|
|
|
|
{
|
|
|
|
|
$woman+=0.5;
|
|
|
|
|
}
|
2011-05-05 11:06:35 +04:00
|
|
|
|
|
2011-07-10 20:09:10 +04:00
|
|
|
|
if ($this->in($this->Last(4), array('льда', 'фира', 'нина', 'лита', 'алья')))
|
2011-07-05 23:24:01 +04:00
|
|
|
|
{
|
|
|
|
|
$woman+=0.5;
|
|
|
|
|
}
|
2011-09-24 22:35:43 +04:00
|
|
|
|
|
2015-11-03 11:19:00 +03:00
|
|
|
|
if ($this->inNames($this->workingWord, $this->names_man))
|
2011-09-24 22:35:43 +04:00
|
|
|
|
{
|
|
|
|
|
$man += 10;
|
|
|
|
|
}
|
|
|
|
|
|
2015-10-28 12:42:17 +03:00
|
|
|
|
if ($this->inNames($this->workingWord, array('Бриджет', 'Элизабет', 'Маргарет', 'Джанет', 'Жаклин', 'Эвелин')))
|
2015-07-27 16:32:20 +03:00
|
|
|
|
{
|
|
|
|
|
$woman += 10;
|
|
|
|
|
}
|
|
|
|
|
|
2015-09-21 13:10:10 +03:00
|
|
|
|
//Исключение для Берил Кук, которая женщина
|
|
|
|
|
if ($this->inNames($this->workingWord, array('Берил')))
|
|
|
|
|
{
|
|
|
|
|
$woman += 0.05;
|
|
|
|
|
}
|
|
|
|
|
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$word->setGender($man, $woman);
|
|
|
|
|
}
|
2011-07-08 16:52:33 +04:00
|
|
|
|
|
|
|
|
|
/**
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* Определение пола по правилам фамилий
|
|
|
|
|
* @param NCLNameCaseWord $word обьект класса слов, для которого нужно определить пол
|
|
|
|
|
*/
|
2011-07-05 23:24:01 +04:00
|
|
|
|
protected function GenderBySecondName(NCLNameCaseWord $word)
|
|
|
|
|
{
|
|
|
|
|
$this->setWorkingWord($word->getWord());
|
2011-05-05 11:06:35 +04:00
|
|
|
|
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$man = 0; //Мужчина
|
|
|
|
|
$woman = 0; //Женщина
|
2011-05-05 11:06:35 +04:00
|
|
|
|
|
2011-07-05 23:24:01 +04:00
|
|
|
|
if ($this->in($this->Last(2), array('ов', 'ин', 'ев', 'ий', 'ёв', 'ый', 'ын', 'ой')))
|
|
|
|
|
{
|
|
|
|
|
$man+=0.4;
|
|
|
|
|
}
|
|
|
|
|
|
2011-07-12 19:59:05 +04:00
|
|
|
|
if ($this->in($this->Last(3), array('ова', 'ина', 'ева', 'ёва', 'ына', 'мин')))
|
2011-07-05 23:24:01 +04:00
|
|
|
|
{
|
|
|
|
|
$woman+=0.4;
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
2011-07-05 23:24:01 +04:00
|
|
|
|
|
|
|
|
|
if ($this->in($this->Last(2), array('ая')))
|
|
|
|
|
{
|
|
|
|
|
$woman+=0.4;
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
$word->setGender($man, $woman);
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
2011-07-08 16:52:33 +04:00
|
|
|
|
|
|
|
|
|
/**
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* Определение пола по правилам отчеств
|
|
|
|
|
* @param NCLNameCaseWord $word обьект класса слов, для которого нужно определить пол
|
|
|
|
|
*/
|
2011-07-05 23:24:01 +04:00
|
|
|
|
protected function GenderByFatherName(NCLNameCaseWord $word)
|
|
|
|
|
{
|
|
|
|
|
$this->setWorkingWord($word->getWord());
|
|
|
|
|
|
|
|
|
|
if ($this->Last(2) == 'ич')
|
|
|
|
|
{
|
|
|
|
|
$word->setGender(10, 0); // мужчина
|
|
|
|
|
}
|
|
|
|
|
if ($this->Last(2) == 'на')
|
|
|
|
|
{
|
|
|
|
|
$word->setGender(0, 12); // женщина
|
|
|
|
|
}
|
|
|
|
|
}
|
|
|
|
|
|
2011-07-08 16:52:33 +04:00
|
|
|
|
/**
|
2011-07-06 15:08:04 +04:00
|
|
|
|
* Идетифицирует слово определяе имя это, или фамилия, или отчество
|
|
|
|
|
* - <b>N</b> - имя
|
|
|
|
|
* - <b>S</b> - фамилия
|
|
|
|
|
* - <b>F</b> - отчество
|
|
|
|
|
* @param NCLNameCaseWord $word обьект класса слов, который необходимо идентифицировать
|
2011-05-05 11:06:35 +04:00
|
|
|
|
*/
|
2011-07-08 16:52:33 +04:00
|
|
|
|
protected function detectNamePart(NCLNameCaseWord $word)
|
2011-05-05 11:06:35 +04:00
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$namepart = $word->getWord();
|
2011-07-20 22:12:17 +04:00
|
|
|
|
$length = NCLStr::strlen($namepart);
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$this->setWorkingWord($namepart);
|
2011-05-05 11:06:35 +04:00
|
|
|
|
|
2011-07-27 16:03:14 +04:00
|
|
|
|
//Считаем вероятность
|
2011-05-05 11:06:35 +04:00
|
|
|
|
$first = 0;
|
|
|
|
|
$second = 0;
|
|
|
|
|
$father = 0;
|
|
|
|
|
|
2011-07-27 16:03:14 +04:00
|
|
|
|
//если смахивает на отчество
|
2011-07-05 23:24:01 +04:00
|
|
|
|
if ($this->in($this->Last(3), array('вна', 'чна', 'вич', 'ьич')))
|
2011-05-05 11:06:35 +04:00
|
|
|
|
{
|
|
|
|
|
$father+=3;
|
|
|
|
|
}
|
2011-07-20 22:12:17 +04:00
|
|
|
|
|
2011-07-20 22:27:57 +04:00
|
|
|
|
if ($this->in($this->Last(2), array('ша')))
|
2011-07-14 12:46:28 +04:00
|
|
|
|
{
|
|
|
|
|
$first+=0.5;
|
|
|
|
|
}
|
2011-07-27 16:10:16 +04:00
|
|
|
|
|
2015-07-24 12:05:06 +03:00
|
|
|
|
if ($this->in($this->Last(3), array('эль'/*Рафаэль, Габриэль*/)))
|
|
|
|
|
{
|
|
|
|
|
$first+=0.5;
|
|
|
|
|
}
|
|
|
|
|
|
2011-07-20 22:12:17 +04:00
|
|
|
|
/**
|
2015-08-07 19:15:10 +03:00
|
|
|
|
* буквы на которые никогда не заканчиваются имена
|
2011-07-20 22:12:17 +04:00
|
|
|
|
*/
|
|
|
|
|
if ($this->in($this->Last(1), 'еёжхцочшщъыэю'))
|
|
|
|
|
{
|
2015-08-07 19:15:10 +03:00
|
|
|
|
/**
|
|
|
|
|
* Просто исключения
|
|
|
|
|
*/
|
|
|
|
|
if ($this->inNames($namepart, array('Мауриц')))
|
|
|
|
|
{
|
|
|
|
|
$first += 10;
|
|
|
|
|
}
|
|
|
|
|
else {
|
2011-07-20 22:12:17 +04:00
|
|
|
|
$second += 0.3;
|
2015-09-21 13:00:37 +03:00
|
|
|
|
}
|
|
|
|
|
}
|
2011-07-27 16:10:16 +04:00
|
|
|
|
|
2011-07-27 16:03:14 +04:00
|
|
|
|
/**
|
|
|
|
|
* Используем массив характерных окончаний
|
|
|
|
|
*/
|
2011-07-27 16:10:16 +04:00
|
|
|
|
if (isset($this->splitSecondExclude[$this->Last(2, 1)]))
|
2011-07-27 16:03:14 +04:00
|
|
|
|
{
|
2011-07-27 16:10:16 +04:00
|
|
|
|
if (!$this->in($this->Last(1), $this->splitSecondExclude[$this->Last(2, 1)]))
|
2011-07-27 16:03:14 +04:00
|
|
|
|
{
|
|
|
|
|
$second += 0.4;
|
|
|
|
|
}
|
|
|
|
|
}
|
2011-07-27 16:10:16 +04:00
|
|
|
|
|
2011-07-27 16:40:37 +04:00
|
|
|
|
/**
|
2015-07-24 12:05:06 +03:00
|
|
|
|
* Сокращенные ласкательные имена типя Аня Галя и.т.д.
|
2011-07-27 16:40:37 +04:00
|
|
|
|
*/
|
|
|
|
|
if ($this->Last(1) == 'я' and $this->in($this->Last(3, 1), $this->vowels))
|
|
|
|
|
{
|
|
|
|
|
$first += 0.5;
|
|
|
|
|
}
|
|
|
|
|
|
2011-07-20 22:12:17 +04:00
|
|
|
|
/**
|
2015-07-23 19:19:51 +03:00
|
|
|
|
* Не бывает имен с такими предпоследними буквами
|
2011-07-20 22:12:17 +04:00
|
|
|
|
*/
|
|
|
|
|
if ($this->in($this->Last(2, 1), 'жчщъэю'))
|
|
|
|
|
{
|
|
|
|
|
$second += 0.3;
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
/**
|
|
|
|
|
* Слова на мягкий знак. Существует очень мало имен на мягкий знак. Все остальное фамилии
|
|
|
|
|
*/
|
|
|
|
|
if ($this->Last(1) == 'ь')
|
|
|
|
|
{
|
|
|
|
|
/**
|
|
|
|
|
* Имена типа нинЕЛь адЕЛь асЕЛь
|
|
|
|
|
*/
|
|
|
|
|
if ($this->Last(3, 2) == 'ел')
|
|
|
|
|
{
|
|
|
|
|
$first += 0.7;
|
|
|
|
|
}
|
|
|
|
|
/**
|
|
|
|
|
* Просто исключения
|
|
|
|
|
*/
|
|
|
|
|
elseif ($this->inNames($namepart, array('Лазарь', 'Игорь', 'Любовь')))
|
|
|
|
|
{
|
|
|
|
|
$first += 10;
|
|
|
|
|
}
|
|
|
|
|
/**
|
|
|
|
|
* Если не то и не другое, тогда фамилия
|
|
|
|
|
*/
|
|
|
|
|
else
|
|
|
|
|
{
|
|
|
|
|
$second += 0.3;
|
|
|
|
|
}
|
|
|
|
|
}
|
|
|
|
|
/**
|
|
|
|
|
* Если две последних букв согласные то скорее всего это фамилия
|
|
|
|
|
*/
|
|
|
|
|
elseif ($this->in($this->Last(1), $this->consonant . 'ь') and $this->in($this->Last(2, 1), $this->consonant . 'ь'))
|
|
|
|
|
{
|
|
|
|
|
/**
|
|
|
|
|
* Практически все кроме тех которые оканчиваются на следующие буквы
|
|
|
|
|
*/
|
|
|
|
|
if (!$this->in($this->Last(2), array('др', 'кт', 'лл', 'пп', 'рд', 'рк', 'рп', 'рт', 'тр')))
|
|
|
|
|
{
|
|
|
|
|
$second += 0.25;
|
|
|
|
|
}
|
|
|
|
|
}
|
|
|
|
|
|
2011-07-27 16:03:14 +04:00
|
|
|
|
/**
|
|
|
|
|
* Слова, которые заканчиваются на тин
|
|
|
|
|
*/
|
2011-07-27 16:10:16 +04:00
|
|
|
|
if ($this->Last(3) == 'тин' and $this->in($this->Last(4, 1), 'нст'))
|
2011-05-05 11:06:35 +04:00
|
|
|
|
{
|
2011-07-27 16:03:14 +04:00
|
|
|
|
$first += 0.5;
|
2011-05-05 11:06:35 +04:00
|
|
|
|
}
|
|
|
|
|
|
2011-07-27 16:03:14 +04:00
|
|
|
|
//Исключения
|
2015-07-23 19:19:51 +03:00
|
|
|
|
if ($this->inNames($namepart, array('Лев', 'Яков', 'Вова', 'Маша', 'Ольга', 'Еремей',
|
2015-11-03 11:19:00 +03:00
|
|
|
|
'Исак', 'Исаак', 'Ева', 'Ирина', 'Элькин', 'Мерлин', 'Макс', 'Алекс',
|
|
|
|
|
'Мариа'/*Альфонс Мариа Муха*/,
|
|
|
|
|
'Бриджет', 'Элизабет', 'Маргарет', 'Джанет', 'Жаклин', 'Эвелин'/*женские иностранные*/))
|
|
|
|
|
|| $this->inNames($namepart, $this->names_man)
|
|
|
|
|
)
|
2011-07-14 12:46:28 +04:00
|
|
|
|
{
|
|
|
|
|
$first+=10;
|
|
|
|
|
}
|
2011-07-20 22:12:17 +04:00
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
/**
|
|
|
|
|
* Фамилии которые заканчиваются на -ли кроме тех что типа натАли и.т.д.
|
|
|
|
|
*/
|
|
|
|
|
if ($this->Last(2) == 'ли' and $this->Last(3, 1) != 'а')
|
2011-05-05 11:06:35 +04:00
|
|
|
|
{
|
2011-07-20 22:12:17 +04:00
|
|
|
|
$second+=0.4;
|
2011-05-05 11:06:35 +04:00
|
|
|
|
}
|
2011-07-20 22:12:17 +04:00
|
|
|
|
|
|
|
|
|
/**
|
|
|
|
|
* Фамилии на -як кроме тех что типа Касьян Куприян + Ян и.т.д.
|
|
|
|
|
*/
|
|
|
|
|
if ($this->Last(2) == 'ян' and $length > 2 and !$this->in($this->Last(3, 1), 'ьи'))
|
|
|
|
|
{
|
|
|
|
|
$second+=0.4;
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
/**
|
|
|
|
|
* Фамилии на -ур кроме имен Артур Тимур
|
|
|
|
|
*/
|
|
|
|
|
if ($this->Last(2) == 'ур')
|
|
|
|
|
{
|
|
|
|
|
if (!$this->inNames($namepart, array('Артур', 'Тимур')))
|
|
|
|
|
{
|
|
|
|
|
$second += 0.4;
|
|
|
|
|
}
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
/**
|
|
|
|
|
* Разбор ласкательных имен на -ик
|
|
|
|
|
*/
|
|
|
|
|
if ($this->Last(2) == 'ик')
|
|
|
|
|
{
|
|
|
|
|
/**
|
|
|
|
|
* Ласкательные буквы перед ик
|
|
|
|
|
*/
|
|
|
|
|
if ($this->in($this->Last(3, 1), 'лшхд'))
|
|
|
|
|
{
|
|
|
|
|
$first += 0.3;
|
|
|
|
|
}
|
|
|
|
|
else
|
|
|
|
|
{
|
|
|
|
|
$second += 0.4;
|
|
|
|
|
}
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
/**
|
|
|
|
|
* Разбор имен и фамилий, который заканчиваются на ина
|
|
|
|
|
*/
|
|
|
|
|
if ($this->Last(3) == 'ина')
|
|
|
|
|
{
|
|
|
|
|
/**
|
|
|
|
|
* Все похожие на Катерина и Кристина
|
|
|
|
|
*/
|
|
|
|
|
if ($this->in($this->Last(7), array('атерина', 'ристина')))
|
|
|
|
|
{
|
|
|
|
|
$first+=10;
|
|
|
|
|
}
|
|
|
|
|
/**
|
|
|
|
|
* Исключения
|
|
|
|
|
*/
|
2015-08-03 15:02:54 +03:00
|
|
|
|
elseif ($this->inNames($namepart, array('Мальвина', 'Антонина', 'Альбина', 'Агриппина', 'Фаина', 'Карина', 'Марина', 'Валентина', 'Калина', 'Аделина', 'Алина', 'Ангелина', 'Галина', 'Каролина', 'Павлина', 'Полина', 'Элина', 'Мина', 'Нина', 'Дина')))
|
2011-07-20 22:12:17 +04:00
|
|
|
|
{
|
|
|
|
|
$first+=10;
|
|
|
|
|
}
|
|
|
|
|
/**
|
|
|
|
|
* Иначе фамилия
|
|
|
|
|
*/
|
|
|
|
|
else
|
|
|
|
|
{
|
|
|
|
|
$second += 0.4;
|
|
|
|
|
}
|
|
|
|
|
}
|
2011-07-27 16:58:34 +04:00
|
|
|
|
|
2011-07-27 16:40:37 +04:00
|
|
|
|
/**
|
|
|
|
|
* Имена типа Николай
|
|
|
|
|
*/
|
2011-07-27 16:58:34 +04:00
|
|
|
|
if ($this->Last(4) == 'олай')
|
2011-07-27 16:40:37 +04:00
|
|
|
|
{
|
|
|
|
|
$first += 0.6;
|
|
|
|
|
}
|
2011-07-27 16:58:34 +04:00
|
|
|
|
|
2011-07-20 22:12:17 +04:00
|
|
|
|
/**
|
|
|
|
|
* Фамильные окончания
|
|
|
|
|
*/
|
2011-09-24 22:35:43 +04:00
|
|
|
|
if ($this->in($this->Last(2), array('ов', 'ин', 'ев', 'ёв', 'ый', 'ын', 'ой', 'ук', 'як', 'ца', 'ун', 'ок', 'ая', 'ёк', 'ив', 'ус', 'ак', 'яр', 'уз', 'ах', 'ай')))
|
2011-05-05 11:06:35 +04:00
|
|
|
|
{
|
|
|
|
|
$second+=0.4;
|
|
|
|
|
}
|
|
|
|
|
|
2011-09-24 22:35:43 +04:00
|
|
|
|
if ($this->in($this->Last(3), array('ова', 'ева', 'ёва', 'ына', 'шен', 'мей', 'вка', 'шир', 'бан', 'чий', 'кий', 'бей', 'чан', 'ган', 'ким', 'кан', 'мар', 'лис')))
|
2011-05-05 11:06:35 +04:00
|
|
|
|
{
|
|
|
|
|
$second+=0.4;
|
|
|
|
|
}
|
|
|
|
|
|
2011-07-20 22:12:17 +04:00
|
|
|
|
if ($this->in($this->Last(4), array('шена')))
|
2011-05-05 11:06:35 +04:00
|
|
|
|
{
|
|
|
|
|
$second+=0.4;
|
|
|
|
|
}
|
|
|
|
|
|
2015-09-23 11:19:34 +03:00
|
|
|
|
//исключения и частички
|
2015-10-28 12:42:17 +03:00
|
|
|
|
if ($this->inNames($namepart, array('да', 'валадон', 'Данбар'))){
|
2015-09-21 13:00:37 +03:00
|
|
|
|
$second += 10;
|
|
|
|
|
}
|
|
|
|
|
|
2011-05-05 11:06:35 +04:00
|
|
|
|
|
|
|
|
|
$max = max(array($first, $second, $father));
|
|
|
|
|
|
|
|
|
|
if ($first == $max)
|
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$word->setNamePart('N');
|
2011-05-05 11:06:35 +04:00
|
|
|
|
}
|
|
|
|
|
elseif ($second == $max)
|
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$word->setNamePart('S');
|
2011-05-05 11:06:35 +04:00
|
|
|
|
}
|
|
|
|
|
else
|
|
|
|
|
{
|
2011-07-05 23:24:01 +04:00
|
|
|
|
$word->setNamePart('F');
|
2011-05-05 11:06:35 +04:00
|
|
|
|
}
|
|
|
|
|
}
|
|
|
|
|
|
2011-05-01 21:50:50 +04:00
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
?>
|