mirror of
https://github.com/retailcrm/NameCaseLib.git
synced 2024-12-05 03:16:06 +03:00
Merge pull request #9 from Rabotyahoff/v0.4.1_work_ra
Изменения для корректной обработки некоторых иностранных имён
This commit is contained in:
commit
7d0fcba980
File diff suppressed because it is too large
Load Diff
@ -6,7 +6,7 @@
|
|||||||
|
|
||||||
/**
|
/**
|
||||||
* NCLNameCaseWord - класс, который служит для хранения всей информации о каждом слове
|
* NCLNameCaseWord - класс, который служит для хранения всей информации о каждом слове
|
||||||
*
|
*
|
||||||
* @author Андрей Чайка <bymer3@gmail.com>
|
* @author Андрей Чайка <bymer3@gmail.com>
|
||||||
* @version 0.4.1
|
* @version 0.4.1
|
||||||
* @package NameCaseLib
|
* @package NameCaseLib
|
||||||
@ -14,282 +14,298 @@
|
|||||||
class NCLNameCaseWord
|
class NCLNameCaseWord
|
||||||
{
|
{
|
||||||
|
|
||||||
/**
|
/**
|
||||||
* Слово в нижнем регистре, которое хранится в об’єкте класса
|
* Слово в нижнем регистре, которое хранится в об’єкте класса
|
||||||
* @var string
|
* @var string
|
||||||
*/
|
*/
|
||||||
private $word = '';
|
private $word = '';
|
||||||
|
|
||||||
/**
|
|
||||||
* Тип текущей записи (Фамилия/Имя/Отчество)
|
|
||||||
* - <b>N</b> - ім’я
|
|
||||||
* - <b>S</b> - прізвище
|
|
||||||
* - <b>F</b> - по-батькові
|
|
||||||
* @var string
|
|
||||||
*/
|
|
||||||
private $namePart = null;
|
|
||||||
|
|
||||||
/**
|
|
||||||
* Вероятность того, что текущей слово относится к мужскому полу
|
|
||||||
* @var int
|
|
||||||
*/
|
|
||||||
private $genderMan = 0;
|
|
||||||
|
|
||||||
/**
|
|
||||||
* Вероятность того, что текущей слово относится к женскому полу
|
|
||||||
* @var int
|
|
||||||
*/
|
|
||||||
private $genderWoman = 0;
|
|
||||||
|
|
||||||
/**
|
|
||||||
* Окончательное решение, к какому полу относится слово
|
|
||||||
* - 0 - не определено
|
|
||||||
* - NCL::$MAN - мужской пол
|
|
||||||
* - NCL::$WOMAN - женский пол
|
|
||||||
* @var int
|
|
||||||
*/
|
|
||||||
private $genderSolved = 0;
|
|
||||||
|
|
||||||
/**
|
|
||||||
* Маска больших букв в слове.
|
|
||||||
*
|
|
||||||
* Содержит информацию о том, какие буквы в слове были большими, а какие мальникими:
|
|
||||||
* - x - маленькая буква
|
|
||||||
* - X - больная буква
|
|
||||||
* @var array
|
|
||||||
*/
|
|
||||||
private $letterMask = array();
|
|
||||||
|
|
||||||
/**
|
|
||||||
* Содержит true, если все слово было в верхнем регистре и false, если не было
|
|
||||||
* @var bool
|
|
||||||
*/
|
|
||||||
private $isUpperCase = false;
|
|
||||||
|
|
||||||
/**
|
|
||||||
* Массив содержит все падежи слова, полученые после склонения текущего слова
|
|
||||||
* @var array
|
|
||||||
*/
|
|
||||||
private $NameCases = array();
|
|
||||||
|
|
||||||
/**
|
|
||||||
* Номер правила, по которому было произведено склонение текущего слова
|
|
||||||
* @var int
|
|
||||||
*/
|
|
||||||
private $rule = 0;
|
|
||||||
|
|
||||||
/**
|
|
||||||
* Создание нового обьекта со словом <var>$word</var>
|
|
||||||
* @param string $word слово
|
|
||||||
*/
|
|
||||||
public function __construct($word)
|
|
||||||
{
|
|
||||||
$this->generateMask($word);
|
|
||||||
$this->word = NCLStr::strtolower($word);
|
|
||||||
}
|
|
||||||
|
|
||||||
/**
|
|
||||||
* Генерирует маску, которая содержит информацию о том, какие буквы в слове были большими, а какие маленькими:
|
|
||||||
* - x - маленькая буква
|
|
||||||
* - X - больная буква
|
|
||||||
* @param string $word слово, для которого генерировать маску
|
|
||||||
*/
|
|
||||||
private function generateMask($word)
|
|
||||||
{
|
|
||||||
$letters = NCLStr::splitLetters($word);
|
|
||||||
$mask = array();
|
|
||||||
$this->isUpperCase = true;
|
|
||||||
foreach ($letters as $letter)
|
|
||||||
{
|
|
||||||
if (NCLStr::isLowerCase($letter))
|
|
||||||
{
|
|
||||||
$mask[] = 'x';
|
|
||||||
$this->isUpperCase = false;
|
|
||||||
}
|
|
||||||
else
|
|
||||||
{
|
|
||||||
$mask[] = 'X';
|
|
||||||
}
|
|
||||||
}
|
|
||||||
$this->letterMask = $mask;
|
|
||||||
}
|
|
||||||
|
|
||||||
/**
|
|
||||||
* Возвращает все падежи слова в начальную маску:
|
|
||||||
* - x - маленькая буква
|
|
||||||
* - X - больная буква
|
|
||||||
*/
|
|
||||||
private function returnMask()
|
|
||||||
{
|
|
||||||
if ($this->isUpperCase)
|
|
||||||
{
|
|
||||||
foreach ($this->NameCases as $index => $case)
|
|
||||||
{
|
|
||||||
$this->NameCases[$index] = NCLStr::strtoupper($this->NameCases[$index]);
|
|
||||||
}
|
|
||||||
}
|
|
||||||
else
|
|
||||||
{
|
|
||||||
$splitedMask = $this->letterMask;
|
|
||||||
$maskLength = count($splitedMask);
|
|
||||||
foreach ($this->NameCases as $index => $case)
|
|
||||||
{
|
|
||||||
$caseLength = NCLStr::strlen($case);
|
|
||||||
|
|
||||||
$max = min(array($caseLength, $maskLength));
|
/**
|
||||||
$this->NameCases[$index] = '';
|
* Оригинальное слово
|
||||||
for ($letterIndex = 0; $letterIndex < $max; $letterIndex++)
|
* @var string
|
||||||
{
|
*/
|
||||||
$letter = NCLStr::substr($case, $letterIndex, 1);
|
private $word_orig = '';
|
||||||
if ($splitedMask[$letterIndex] == 'X')
|
|
||||||
{
|
/**
|
||||||
$letter = NCLStr::strtoupper($letter);
|
* Тип текущей записи (Фамилия/Имя/Отчество)
|
||||||
}
|
* - <b>N</b> - ім’я
|
||||||
$this->NameCases[$index] .= $letter;
|
* - <b>S</b> - прізвище
|
||||||
}
|
* - <b>F</b> - по-батькові
|
||||||
$this->NameCases[$index] .= NCLStr::substr($case, $max, $caseLength-$maskLength);
|
* @var string
|
||||||
}
|
*/
|
||||||
}
|
private $namePart = null;
|
||||||
}
|
|
||||||
|
/**
|
||||||
/**
|
* Вероятность того, что текущей слово относится к мужскому полу
|
||||||
* Сохраняет результат склонения текущего слова
|
* @var int
|
||||||
* @param array $nameCases массив со всеми падежами
|
*/
|
||||||
*/
|
private $genderMan = 0;
|
||||||
public function setNameCases($nameCases)
|
|
||||||
{
|
/**
|
||||||
$this->NameCases = $nameCases;
|
* Вероятность того, что текущей слово относится к женскому полу
|
||||||
$this->returnMask();
|
* @var int
|
||||||
}
|
*/
|
||||||
|
private $genderWoman = 0;
|
||||||
/**
|
|
||||||
* Возвращает массив со всеми падежами текущего слова
|
/**
|
||||||
* @return array массив со всеми падежами
|
* Окончательное решение, к какому полу относится слово
|
||||||
*/
|
* - 0 - не определено
|
||||||
public function getNameCases()
|
* - NCL::$MAN - мужской пол
|
||||||
{
|
* - NCL::$WOMAN - женский пол
|
||||||
return $this->NameCases;
|
* @var int
|
||||||
}
|
*/
|
||||||
|
private $genderSolved = 0;
|
||||||
/**
|
|
||||||
* Возвращает строку с нужным падежом текущего слова
|
/**
|
||||||
* @param int $number нужный падеж
|
* Маска больших букв в слове.
|
||||||
* @return string строка с нужным падежом текущего слова
|
*
|
||||||
*/
|
* Содержит информацию о том, какие буквы в слове были большими, а какие мальникими:
|
||||||
public function getNameCase($number)
|
* - x - маленькая буква
|
||||||
{
|
* - X - больная буква
|
||||||
if(isset($this->NameCases[$number]))
|
* @var array
|
||||||
{
|
*/
|
||||||
return $this->NameCases[$number];
|
private $letterMask = array();
|
||||||
}
|
|
||||||
return false;
|
/**
|
||||||
}
|
* Содержит true, если все слово было в верхнем регистре и false, если не было
|
||||||
|
* @var bool
|
||||||
/**
|
*/
|
||||||
* Расчитывает и возвращает пол текущего слова
|
private $isUpperCase = false;
|
||||||
* @return int пол текущего слова
|
|
||||||
*/
|
/**
|
||||||
public function gender()
|
* Массив содержит все падежи слова, полученые после склонения текущего слова
|
||||||
{
|
* @var array
|
||||||
if (!$this->genderSolved)
|
*/
|
||||||
{
|
private $NameCases = array();
|
||||||
if ($this->genderMan > $this->genderWoman)
|
|
||||||
{
|
/**
|
||||||
$this->genderSolved = NCL::$MAN;
|
* Номер правила, по которому было произведено склонение текущего слова
|
||||||
}
|
* @var int
|
||||||
else
|
*/
|
||||||
{
|
private $rule = 0;
|
||||||
$this->genderSolved = NCL::$WOMAN;
|
|
||||||
}
|
/**
|
||||||
}
|
* Создание нового обьекта со словом <var>$word</var>
|
||||||
return $this->genderSolved;
|
* @param string $word слово
|
||||||
}
|
*/
|
||||||
|
public function __construct($word)
|
||||||
/**
|
{
|
||||||
* Устанавливает вероятности того, что даное слово является мужчиной или женщиной
|
$this->word_orig=$word;
|
||||||
* @param int $man вероятность того, что слово мужчина
|
$this->generateMask($word);
|
||||||
* @param int $woman верятность того, что слово женщина
|
$this->word = NCLStr::strtolower($word);
|
||||||
*/
|
}
|
||||||
public function setGender($man, $woman)
|
|
||||||
{
|
/**
|
||||||
$this->genderMan = $man;
|
* Генерирует маску, которая содержит информацию о том, какие буквы в слове были большими, а какие маленькими:
|
||||||
$this->genderWoman = $woman;
|
* - x - маленькая буква
|
||||||
}
|
* - X - больная буква
|
||||||
|
* @param string $word слово, для которого генерировать маску
|
||||||
/**
|
*/
|
||||||
* Окончательно устанавливает пол человека
|
private function generateMask($word)
|
||||||
* - 0 - не определено
|
{
|
||||||
* - NCL::$MAN - мужчина
|
$letters = NCLStr::splitLetters($word);
|
||||||
* - NCL::$WOMAN - женщина
|
$mask = array();
|
||||||
* @param int $gender пол человека
|
$this->isUpperCase = true;
|
||||||
*/
|
foreach ($letters as $letter)
|
||||||
public function setTrueGender($gender)
|
{
|
||||||
{
|
if (NCLStr::isLowerCase($letter))
|
||||||
$this->genderSolved = $gender;
|
{
|
||||||
}
|
$mask[] = 'x';
|
||||||
|
$this->isUpperCase = false;
|
||||||
/**
|
}
|
||||||
* Возвращает массив вероятности того, что даное слово является мужчиной или женщиной
|
else
|
||||||
* @return array массив вероятностей
|
{
|
||||||
*/
|
$mask[] = 'X';
|
||||||
public function getGender()
|
}
|
||||||
{
|
}
|
||||||
return array(NCL::$MAN => $this->genderMan, NCL::$WOMAN => $this->genderWoman);
|
$this->letterMask = $mask;
|
||||||
}
|
}
|
||||||
|
|
||||||
/**
|
/**
|
||||||
* Устанавливает тип текущего слова
|
* Возвращает все падежи слова в начальную маску:
|
||||||
* <b>Тип слова:</b>
|
* - x - маленькая буква
|
||||||
* - S - Фамилия
|
* - X - больная буква
|
||||||
* - N - Имя
|
*/
|
||||||
* - F - Отчество
|
private function returnMask()
|
||||||
* @param string $namePart тип слова
|
{
|
||||||
*/
|
if ($this->isUpperCase)
|
||||||
public function setNamePart($namePart)
|
{
|
||||||
{
|
foreach ($this->NameCases as $index => $case)
|
||||||
$this->namePart = $namePart;
|
{
|
||||||
}
|
$this->NameCases[$index] = NCLStr::strtoupper($this->NameCases[$index]);
|
||||||
|
}
|
||||||
/**
|
}
|
||||||
* Возвращает тип текущего слова
|
else
|
||||||
* <b>Тип слова:</b>
|
{
|
||||||
* - S - Фамилия
|
$splitedMask = $this->letterMask;
|
||||||
* - N - Имя
|
$maskLength = count($splitedMask);
|
||||||
* - F - Отчество
|
foreach ($this->NameCases as $index => $case)
|
||||||
* @return string $namePart тип слова
|
{
|
||||||
*/
|
$caseLength = NCLStr::strlen($case);
|
||||||
public function getNamePart()
|
|
||||||
{
|
$max = min(array($caseLength, $maskLength));
|
||||||
return $this->namePart;
|
$this->NameCases[$index] = '';
|
||||||
}
|
for ($letterIndex = 0; $letterIndex < $max; $letterIndex++)
|
||||||
|
{
|
||||||
/**
|
$letter = NCLStr::substr($case, $letterIndex, 1);
|
||||||
* Возвращает текущее слово.
|
if ($splitedMask[$letterIndex] == 'X')
|
||||||
* @return string текущее слово
|
{
|
||||||
*/
|
$letter = NCLStr::strtoupper($letter);
|
||||||
public function getWord()
|
}
|
||||||
{
|
$this->NameCases[$index] .= $letter;
|
||||||
return $this->word;
|
}
|
||||||
}
|
$this->NameCases[$index] .= NCLStr::substr($case, $max, $caseLength-$maskLength);
|
||||||
|
}
|
||||||
/**
|
}
|
||||||
* Если уже был расчитан пол для всех слов системы, тогда каждому слову предается окончательное
|
}
|
||||||
* решение. Эта функция определяет было ли принято окончательное решение.
|
|
||||||
* @return bool было ли принято окончательное решение по поводу пола текущего слова
|
/**
|
||||||
*/
|
* Сохраняет результат склонения текущего слова
|
||||||
public function isGenderSolved()
|
* @param array $nameCases массив со всеми падежами
|
||||||
{
|
*/
|
||||||
return ($this->genderSolved ? true : false);
|
public function setNameCases($nameCases, $is_return_mask=true)
|
||||||
}
|
{
|
||||||
|
$this->NameCases = $nameCases;
|
||||||
/**
|
if ($is_return_mask) $this->returnMask();
|
||||||
* Устанавливает номер правила по которому склонялось текущее слово.
|
}
|
||||||
* @param int $ruleID номер правила
|
|
||||||
*/
|
/**
|
||||||
public function setRule($ruleID)
|
* Возвращает массив со всеми падежами текущего слова
|
||||||
{
|
* @return array массив со всеми падежами
|
||||||
$this->rule = $ruleID;
|
*/
|
||||||
}
|
public function getNameCases()
|
||||||
|
{
|
||||||
|
return $this->NameCases;
|
||||||
|
}
|
||||||
|
|
||||||
|
/**
|
||||||
|
* Возвращает строку с нужным падежом текущего слова
|
||||||
|
* @param int $number нужный падеж
|
||||||
|
* @return string строка с нужным падежом текущего слова
|
||||||
|
*/
|
||||||
|
public function getNameCase($number)
|
||||||
|
{
|
||||||
|
if(isset($this->NameCases[$number]))
|
||||||
|
{
|
||||||
|
return $this->NameCases[$number];
|
||||||
|
}
|
||||||
|
return false;
|
||||||
|
}
|
||||||
|
|
||||||
|
/**
|
||||||
|
* Расчитывает и возвращает пол текущего слова
|
||||||
|
* @return int пол текущего слова
|
||||||
|
*/
|
||||||
|
public function gender()
|
||||||
|
{
|
||||||
|
if (!$this->genderSolved)
|
||||||
|
{
|
||||||
|
if ($this->genderMan >= $this->genderWoman)
|
||||||
|
{
|
||||||
|
$this->genderSolved = NCL::$MAN;
|
||||||
|
}
|
||||||
|
else
|
||||||
|
{
|
||||||
|
$this->genderSolved = NCL::$WOMAN;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
return $this->genderSolved;
|
||||||
|
}
|
||||||
|
|
||||||
|
/**
|
||||||
|
* Устанавливает вероятности того, что даное слово является мужчиной или женщиной
|
||||||
|
* @param int $man вероятность того, что слово мужчина
|
||||||
|
* @param int $woman верятность того, что слово женщина
|
||||||
|
*/
|
||||||
|
public function setGender($man, $woman)
|
||||||
|
{
|
||||||
|
$this->genderMan = $man;
|
||||||
|
$this->genderWoman = $woman;
|
||||||
|
}
|
||||||
|
|
||||||
|
/**
|
||||||
|
* Окончательно устанавливает пол человека
|
||||||
|
* - 0 - не определено
|
||||||
|
* - NCL::$MAN - мужчина
|
||||||
|
* - NCL::$WOMAN - женщина
|
||||||
|
* @param int $gender пол человека
|
||||||
|
*/
|
||||||
|
public function setTrueGender($gender)
|
||||||
|
{
|
||||||
|
$this->genderSolved = $gender;
|
||||||
|
}
|
||||||
|
|
||||||
|
/**
|
||||||
|
* Возвращает массив вероятности того, что даное слово является мужчиной или женщиной
|
||||||
|
* @return array массив вероятностей
|
||||||
|
*/
|
||||||
|
public function getGender()
|
||||||
|
{
|
||||||
|
return array(NCL::$MAN => $this->genderMan, NCL::$WOMAN => $this->genderWoman);
|
||||||
|
}
|
||||||
|
|
||||||
|
/**
|
||||||
|
* Устанавливает тип текущего слова
|
||||||
|
* <b>Тип слова:</b>
|
||||||
|
* - S - Фамилия
|
||||||
|
* - N - Имя
|
||||||
|
* - F - Отчество
|
||||||
|
* @param string $namePart тип слова
|
||||||
|
*/
|
||||||
|
public function setNamePart($namePart)
|
||||||
|
{
|
||||||
|
$this->namePart = $namePart;
|
||||||
|
}
|
||||||
|
|
||||||
|
/**
|
||||||
|
* Возвращает тип текущего слова
|
||||||
|
* <b>Тип слова:</b>
|
||||||
|
* - S - Фамилия
|
||||||
|
* - N - Имя
|
||||||
|
* - F - Отчество
|
||||||
|
* @return string $namePart тип слова
|
||||||
|
*/
|
||||||
|
public function getNamePart()
|
||||||
|
{
|
||||||
|
return $this->namePart;
|
||||||
|
}
|
||||||
|
|
||||||
|
/**
|
||||||
|
* Возвращает текущее слово.
|
||||||
|
* @return string текущее слово
|
||||||
|
*/
|
||||||
|
public function getWord()
|
||||||
|
{
|
||||||
|
return $this->word;
|
||||||
|
}
|
||||||
|
|
||||||
|
/**
|
||||||
|
* Возвращает текущее оригинальное слово.
|
||||||
|
* @return string текущее слово
|
||||||
|
*/
|
||||||
|
public function getWordOrig()
|
||||||
|
{
|
||||||
|
return $this->word_orig;
|
||||||
|
}
|
||||||
|
|
||||||
|
/**
|
||||||
|
* Если уже был расчитан пол для всех слов системы, тогда каждому слову предается окончательное
|
||||||
|
* решение. Эта функция определяет было ли принято окончательное решение.
|
||||||
|
* @return bool было ли принято окончательное решение по поводу пола текущего слова
|
||||||
|
*/
|
||||||
|
public function isGenderSolved()
|
||||||
|
{
|
||||||
|
return ($this->genderSolved ? true : false);
|
||||||
|
}
|
||||||
|
|
||||||
|
/**
|
||||||
|
* Устанавливает номер правила по которому склонялось текущее слово.
|
||||||
|
* @param int $ruleID номер правила
|
||||||
|
*/
|
||||||
|
public function setRule($ruleID)
|
||||||
|
{
|
||||||
|
$this->rule = $ruleID;
|
||||||
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
?>
|
?>
|
||||||
|
@ -52,7 +52,7 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
* Окончания имен/фамилий, который не склоняются
|
* Окончания имен/фамилий, который не склоняются
|
||||||
* @var array
|
* @var array
|
||||||
*/
|
*/
|
||||||
private $ih = array('их', 'ых', 'ко');
|
private $ih = array('их', 'ых', 'ко', 'уа'/*Бенуа, Франсуа*/);
|
||||||
/**
|
/**
|
||||||
* Список окончаний характерных для фамилий
|
* Список окончаний характерных для фамилий
|
||||||
* По шаблону {letter}* где * любой символ кроме тех, что в {exclude}
|
* По шаблону {letter}* где * любой символ кроме тех, что в {exclude}
|
||||||
@ -94,6 +94,14 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
'я' => 'нс'
|
'я' => 'нс'
|
||||||
);
|
);
|
||||||
|
|
||||||
|
private $names_man=array('Вова', 'Анри', 'Питер', 'Пауль', 'Франц', 'Вильям', 'Уильям',
|
||||||
|
'Альфонс', 'Ганс', 'Франс', 'Филиппо', 'Андреа', 'Корнелис', 'Фрэнк', 'Леонардо',
|
||||||
|
'Джеймс', 'Отто', 'жан-пьер', 'Джованни', 'Джозеф', 'Педро', 'Адольф', 'Уолтер',
|
||||||
|
'Антонио', 'Якоб', 'Эсташ', 'Адрианс', 'Франческо', 'Доменико', 'Ханс', 'Гун',
|
||||||
|
'Шарль', 'Хендрик', 'Амброзиус', 'Таддео', 'Фердинанд', 'Джошуа', 'Изак', 'Иоганн',
|
||||||
|
'Фридрих', 'Эмиль', 'Умберто', 'Франсуа', 'Ян', 'Эрнст', 'Георг', 'Карл'
|
||||||
|
);
|
||||||
|
|
||||||
/**
|
/**
|
||||||
* Мужские имена, оканчивающиеся на любой ь и -й,
|
* Мужские имена, оканчивающиеся на любой ь и -й,
|
||||||
* склоняются так же, как обычные существительные мужского рода
|
* склоняются так же, как обычные существительные мужского рода
|
||||||
@ -103,16 +111,23 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
{
|
{
|
||||||
if ($this->in($this->Last(1), 'ьй'))
|
if ($this->in($this->Last(1), 'ьй'))
|
||||||
{
|
{
|
||||||
|
if ($this->inNames($this->workingWord, array('Дель')))
|
||||||
|
{
|
||||||
|
$this->Rule(101);
|
||||||
|
$this->makeResultTheSame();
|
||||||
|
return true;
|
||||||
|
}
|
||||||
|
|
||||||
if ($this->Last(2, 1) != "и")
|
if ($this->Last(2, 1) != "и")
|
||||||
{
|
{
|
||||||
$this->wordForms($this->workingWord, array('я', 'ю', 'я', 'ем', 'е'), 1);
|
$this->wordForms($this->workingWord, array('я', 'ю', 'я', 'ем', 'е'), 1);
|
||||||
$this->Rule(101);
|
$this->Rule(102);
|
||||||
return true;
|
return true;
|
||||||
}
|
}
|
||||||
else
|
else
|
||||||
{
|
{
|
||||||
$this->wordForms($this->workingWord, array('я', 'ю', 'я', 'ем', 'и'), 1);
|
$this->wordForms($this->workingWord, array('я', 'ю', 'я', 'ем', 'и'), 1);
|
||||||
$this->Rule(102);
|
$this->Rule(103);
|
||||||
return true;
|
return true;
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
@ -140,10 +155,16 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
$this->Rule(202);
|
$this->Rule(202);
|
||||||
return true;
|
return true;
|
||||||
}
|
}
|
||||||
|
elseif ($this->inNames($this->workingWord, 'ван'))
|
||||||
|
{
|
||||||
|
$this->Rule(203);
|
||||||
|
$this->makeResultTheSame();
|
||||||
|
return true;
|
||||||
|
}
|
||||||
else
|
else
|
||||||
{
|
{
|
||||||
$this->wordForms($this->workingWord, array('а', 'у', 'а', 'ом', 'е'));
|
$this->wordForms($this->workingWord, array('а', 'у', 'а', 'ом', 'е'));
|
||||||
$this->Rule(203);
|
$this->Rule(204);
|
||||||
return true;
|
return true;
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
@ -161,16 +182,22 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
{
|
{
|
||||||
if ($this->Last(1) == "а")
|
if ($this->Last(1) == "а")
|
||||||
{
|
{
|
||||||
if (!$this->in($this->Last(2, 1), 'кшгх'))
|
if ($this->inNames($this->workingWord, array('фра', 'Дега', 'Андреа', 'Сёра', 'Сера')))
|
||||||
|
{
|
||||||
|
$this->Rule(301);
|
||||||
|
$this->makeResultTheSame();
|
||||||
|
return true;
|
||||||
|
}
|
||||||
|
elseif (!$this->in($this->Last(2, 1), 'кшгх'))
|
||||||
{
|
{
|
||||||
$this->wordForms($this->workingWord, array('ы', 'е', 'у', 'ой', 'е'), 1);
|
$this->wordForms($this->workingWord, array('ы', 'е', 'у', 'ой', 'е'), 1);
|
||||||
$this->Rule(301);
|
$this->Rule(302);
|
||||||
return true;
|
return true;
|
||||||
}
|
}
|
||||||
else
|
else
|
||||||
{
|
{
|
||||||
$this->wordForms($this->workingWord, array('и', 'е', 'у', 'ой', 'е'), 1);
|
$this->wordForms($this->workingWord, array('и', 'е', 'у', 'ой', 'е'), 1);
|
||||||
$this->Rule(302);
|
$this->Rule(303);
|
||||||
return true;
|
return true;
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
@ -245,13 +272,13 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
if ($this->Last(1) == 'к')
|
if ($this->Last(1) == 'к')
|
||||||
{
|
{
|
||||||
//Если перед слово на ок, то нужно убрать о
|
//Если перед слово на ок, то нужно убрать о
|
||||||
if ($this->Last(2, 1) == 'о')
|
if ($this->Last(4)=='енок' || $this->Last(4)=='ёнок')//Поллок
|
||||||
{
|
{
|
||||||
$this->wordForms($this->workingWord, array('ка', 'ку', 'ка', 'ком', 'ке'), 2);
|
$this->wordForms($this->workingWord, array('ка', 'ку', 'ка', 'ком', 'ке'), 2);
|
||||||
$this->Rule(501);
|
$this->Rule(501);
|
||||||
return true;
|
return true;
|
||||||
}
|
}
|
||||||
if ($this->Last(2, 1) == 'е')
|
if ($this->Last(2, 1) == 'е' && !in_array($this->Last(3, 1), array('р')))//Лотрек
|
||||||
{
|
{
|
||||||
$this->wordForms($this->workingWord, array('ька', 'ьку', 'ька', 'ьком', 'ьке'), 2);
|
$this->wordForms($this->workingWord, array('ька', 'ьку', 'ька', 'ьком', 'ьке'), 2);
|
||||||
$this->Rule(502);
|
$this->Rule(502);
|
||||||
@ -309,30 +336,36 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
{
|
{
|
||||||
if ($this->Last(1) == "а")
|
if ($this->Last(1) == "а")
|
||||||
{
|
{
|
||||||
|
if ($this->inNames($this->workingWord, array('да')))
|
||||||
|
{
|
||||||
|
$this->Rule(701);
|
||||||
|
$this->makeResultTheSame();
|
||||||
|
return true;
|
||||||
|
}
|
||||||
//Если основа на ш, то нужно и, ей
|
//Если основа на ш, то нужно и, ей
|
||||||
if ($this->Last(2, 1) == 'ш')
|
if ($this->Last(2, 1) == 'ш')
|
||||||
{
|
{
|
||||||
$this->wordForms($this->workingWord, array('и', 'е', 'у', 'ей', 'е'), 1);
|
$this->wordForms($this->workingWord, array('и', 'е', 'у', 'ей', 'е'), 1);
|
||||||
$this->Rule(701);
|
$this->Rule(702);
|
||||||
return true;
|
return true;
|
||||||
}
|
}
|
||||||
elseif ($this->in($this->Last(2, 1), 'хкг'))
|
elseif ($this->in($this->Last(2, 1), 'хкг'))
|
||||||
{
|
{
|
||||||
$this->wordForms($this->workingWord, array('и', 'е', 'у', 'ой', 'е'), 1);
|
$this->wordForms($this->workingWord, array('и', 'е', 'у', 'ой', 'е'), 1);
|
||||||
$this->Rule(702);
|
$this->Rule(703);
|
||||||
return true;
|
return true;
|
||||||
}
|
}
|
||||||
else
|
else
|
||||||
{
|
{
|
||||||
$this->wordForms($this->workingWord, array('ы', 'е', 'у', 'ой', 'е'), 1);
|
$this->wordForms($this->workingWord, array('ы', 'е', 'у', 'ой', 'е'), 1);
|
||||||
$this->Rule(703);
|
$this->Rule(704);
|
||||||
return true;
|
return true;
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
elseif ($this->Last(1) == "я")
|
elseif ($this->Last(1) == "я")
|
||||||
{
|
{
|
||||||
$this->wordForms($this->workingWord, array('ой', 'ой', 'ую', 'ой', 'ой'), 2);
|
$this->wordForms($this->workingWord, array('ой', 'ой', 'ую', 'ой', 'ой'), 2);
|
||||||
$this->Rule(704);
|
$this->Rule(705);
|
||||||
return true;
|
return true;
|
||||||
}
|
}
|
||||||
return false;
|
return false;
|
||||||
@ -344,8 +377,9 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
*/
|
*/
|
||||||
protected function manRule8()
|
protected function manRule8()
|
||||||
{
|
{
|
||||||
if ($this->in($this->Last(3), $this->ovo) or $this->in($this->Last(2), $this->ih))
|
if ($this->in($this->Last(3), $this->ovo) || $this->in($this->Last(2), $this->ih))
|
||||||
{
|
{
|
||||||
|
if ( $this->inNames($this->workingWord, array('рерих')) ) return false;
|
||||||
$this->Rule(8);
|
$this->Rule(8);
|
||||||
$this->makeResultTheSame();
|
$this->makeResultTheSame();
|
||||||
return true;
|
return true;
|
||||||
@ -473,6 +507,17 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
*/
|
*/
|
||||||
protected function manFirstName()
|
protected function manFirstName()
|
||||||
{
|
{
|
||||||
|
if ($this->inNames($this->workingWord, array('Старший', 'Младший')))
|
||||||
|
{
|
||||||
|
$this->wordForms($this->workingWord, array('его', 'ему', 'его', 'им', 'ем'), 2);
|
||||||
|
return true;
|
||||||
|
}
|
||||||
|
if ($this->inNames($this->workingWord, array('Мариа')))
|
||||||
|
{
|
||||||
|
//Альфонс Мария Муха
|
||||||
|
$this->wordForms($this->workingWord, array('и', 'и', 'ю', 'ей', 'ии'), 1);
|
||||||
|
return true;
|
||||||
|
}
|
||||||
return $this->RulesChain('man', array(1, 2, 3));
|
return $this->RulesChain('man', array(1, 2, 3));
|
||||||
}
|
}
|
||||||
|
|
||||||
@ -504,11 +549,11 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
}
|
}
|
||||||
|
|
||||||
/**
|
/**
|
||||||
* Функция склоняет мужский отчества
|
* Функция склоняет мужские отчества
|
||||||
* @return boolean true - если слово было успешно изменено, false - если не получилось этого сделать
|
* @return boolean true - если слово было успешно изменено, false - если не получилось этого сделать
|
||||||
*/
|
*/
|
||||||
protected function manFatherName()
|
protected function manFatherName()
|
||||||
{
|
{
|
||||||
//Проверяем действительно ли отчество
|
//Проверяем действительно ли отчество
|
||||||
if ($this->inNames($this->workingWord, 'Ильич'))
|
if ($this->inNames($this->workingWord, 'Ильич'))
|
||||||
{
|
{
|
||||||
@ -554,7 +599,7 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
{
|
{
|
||||||
$man+=0.9;
|
$man+=0.9;
|
||||||
}
|
}
|
||||||
if ($this->in($this->Last(2), array('он', 'ов', 'ав', 'ам', 'ол', 'ан', 'рд', 'мп')))
|
if ($this->in($this->Last(2), array('он', 'ов', 'ав', 'ам', 'ол', 'ан', 'рд', 'мп', 'по'/*Филиппо*/, 'до'/*Леонардо*/, 'др', 'рт')))
|
||||||
{
|
{
|
||||||
$man+=0.3;
|
$man+=0.3;
|
||||||
}
|
}
|
||||||
@ -567,7 +612,7 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
$man+=0.02;
|
$man+=0.02;
|
||||||
}
|
}
|
||||||
|
|
||||||
if ($this->in($this->Last(2), array('вь', 'фь', 'ль')))
|
if ($this->in($this->Last(2), array('вь', 'фь', 'ль', 'на')))
|
||||||
{
|
{
|
||||||
$woman+=0.1;
|
$woman+=0.1;
|
||||||
}
|
}
|
||||||
@ -582,7 +627,7 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
$man+=0.01;
|
$man+=0.01;
|
||||||
}
|
}
|
||||||
|
|
||||||
if ($this->in($this->Last(3), array('лья', 'вва', 'ока', 'ука', 'ита')))
|
if ($this->in($this->Last(3), array('лья', 'вва', 'ока', 'ука', 'ита', 'эль'/*Рафаэль, Габриэль*/, 'реа'/*Андреа*/)))
|
||||||
{
|
{
|
||||||
$man+=0.2;
|
$man+=0.2;
|
||||||
}
|
}
|
||||||
@ -592,7 +637,7 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
$woman+=0.15;
|
$woman+=0.15;
|
||||||
}
|
}
|
||||||
|
|
||||||
if ($this->in($this->Last(3), array('лия', 'ния', 'сия', 'дра', 'лла', 'кла', 'опа')))
|
if ($this->in($this->Last(3), array('лия', 'ния', 'сия', 'дра', 'лла', 'кла', 'опа', 'вия')))
|
||||||
{
|
{
|
||||||
$woman+=0.5;
|
$woman+=0.5;
|
||||||
}
|
}
|
||||||
@ -602,11 +647,22 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
$woman+=0.5;
|
$woman+=0.5;
|
||||||
}
|
}
|
||||||
|
|
||||||
if ($this->inNames($this->workingWord, 'Вова'))
|
if ($this->inNames($this->workingWord, $this->names_man))
|
||||||
{
|
{
|
||||||
$man += 10;
|
$man += 10;
|
||||||
}
|
}
|
||||||
|
|
||||||
|
if ($this->inNames($this->workingWord, array('Бриджет', 'Элизабет', 'Маргарет', 'Джанет', 'Жаклин', 'Эвелин')))
|
||||||
|
{
|
||||||
|
$woman += 10;
|
||||||
|
}
|
||||||
|
|
||||||
|
//Исключение для Берил Кук, которая женщина
|
||||||
|
if ($this->inNames($this->workingWord, array('Берил')))
|
||||||
|
{
|
||||||
|
$woman += 0.05;
|
||||||
|
}
|
||||||
|
|
||||||
$word->setGender($man, $woman);
|
$word->setGender($man, $woman);
|
||||||
}
|
}
|
||||||
|
|
||||||
@ -686,13 +742,27 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
$first+=0.5;
|
$first+=0.5;
|
||||||
}
|
}
|
||||||
|
|
||||||
|
if ($this->in($this->Last(3), array('эль'/*Рафаэль, Габриэль*/)))
|
||||||
|
{
|
||||||
|
$first+=0.5;
|
||||||
|
}
|
||||||
|
|
||||||
/**
|
/**
|
||||||
* буквы на которые никогда не закнчиваются имена
|
* буквы на которые никогда не заканчиваются имена
|
||||||
*/
|
*/
|
||||||
if ($this->in($this->Last(1), 'еёжхцочшщъыэю'))
|
if ($this->in($this->Last(1), 'еёжхцочшщъыэю'))
|
||||||
{
|
{
|
||||||
|
/**
|
||||||
|
* Просто исключения
|
||||||
|
*/
|
||||||
|
if ($this->inNames($namepart, array('Мауриц')))
|
||||||
|
{
|
||||||
|
$first += 10;
|
||||||
|
}
|
||||||
|
else {
|
||||||
$second += 0.3;
|
$second += 0.3;
|
||||||
}
|
}
|
||||||
|
}
|
||||||
|
|
||||||
/**
|
/**
|
||||||
* Используем массив характерных окончаний
|
* Используем массив характерных окончаний
|
||||||
@ -706,7 +776,7 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
}
|
}
|
||||||
|
|
||||||
/**
|
/**
|
||||||
* Сохкращенные ласкательные имена типя Аня Галя и.т.д.
|
* Сокращенные ласкательные имена типя Аня Галя и.т.д.
|
||||||
*/
|
*/
|
||||||
if ($this->Last(1) == 'я' and $this->in($this->Last(3, 1), $this->vowels))
|
if ($this->Last(1) == 'я' and $this->in($this->Last(3, 1), $this->vowels))
|
||||||
{
|
{
|
||||||
@ -714,7 +784,7 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
}
|
}
|
||||||
|
|
||||||
/**
|
/**
|
||||||
* Не бывает имет с такими предпоследними буквами
|
* Не бывает имен с такими предпоследними буквами
|
||||||
*/
|
*/
|
||||||
if ($this->in($this->Last(2, 1), 'жчщъэю'))
|
if ($this->in($this->Last(2, 1), 'жчщъэю'))
|
||||||
{
|
{
|
||||||
@ -771,7 +841,12 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
}
|
}
|
||||||
|
|
||||||
//Исключения
|
//Исключения
|
||||||
if ($this->inNames($namepart, array('Лев', 'Яков', 'Вова', 'Маша', 'Ольга', 'Еремей', 'Исак', 'Исаак', 'Ева', 'Ирина', 'Элькин', 'Мерлин')))
|
if ($this->inNames($namepart, array('Лев', 'Яков', 'Вова', 'Маша', 'Ольга', 'Еремей',
|
||||||
|
'Исак', 'Исаак', 'Ева', 'Ирина', 'Элькин', 'Мерлин', 'Макс', 'Алекс',
|
||||||
|
'Мариа'/*Альфонс Мариа Муха*/,
|
||||||
|
'Бриджет', 'Элизабет', 'Маргарет', 'Джанет', 'Жаклин', 'Эвелин'/*женские иностранные*/))
|
||||||
|
|| $this->inNames($namepart, $this->names_man)
|
||||||
|
)
|
||||||
{
|
{
|
||||||
$first+=10;
|
$first+=10;
|
||||||
}
|
}
|
||||||
@ -838,7 +913,7 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
/**
|
/**
|
||||||
* Исключения
|
* Исключения
|
||||||
*/
|
*/
|
||||||
elseif ($this->inNames($namepart, array('Мальвина', 'Антонина', 'Альбина', 'Агриппина', 'Фаина', 'Карина', 'Марина', 'Валентина', 'Калина', 'Аделина', 'Алина', 'Ангелина', 'Галина', 'Каролина', 'Павлина', 'Полина', 'Элина', 'Мина', 'Нина')))
|
elseif ($this->inNames($namepart, array('Мальвина', 'Антонина', 'Альбина', 'Агриппина', 'Фаина', 'Карина', 'Марина', 'Валентина', 'Калина', 'Аделина', 'Алина', 'Ангелина', 'Галина', 'Каролина', 'Павлина', 'Полина', 'Элина', 'Мина', 'Нина', 'Дина')))
|
||||||
{
|
{
|
||||||
$first+=10;
|
$first+=10;
|
||||||
}
|
}
|
||||||
@ -877,6 +952,11 @@ class NCLNameCaseRu extends NCLNameCaseCore
|
|||||||
$second+=0.4;
|
$second+=0.4;
|
||||||
}
|
}
|
||||||
|
|
||||||
|
//исключения и частички
|
||||||
|
if ($this->inNames($namepart, array('да', 'валадон', 'Данбар'))){
|
||||||
|
$second += 10;
|
||||||
|
}
|
||||||
|
|
||||||
|
|
||||||
$max = max(array($first, $second, $father));
|
$max = max(array($first, $second, $father));
|
||||||
|
|
||||||
|
Loading…
Reference in New Issue
Block a user