NameCaseLib/Library/NCL.NameCase.ru.php

701 lines
30 KiB
PHP
Raw Normal View History

2011-05-01 20:50:50 +03:00
<?php
/*
* NCL NameCase Russian Language
*
* Клас, которые позволяет склонять русские Имена, Фамили Отчества по падежам.
*
* @license Dual licensed under the MIT or GPL Version 2 licenses.
* @author Андрей Чайка http://seagull.net.ua/ bymer3@gmail.com
* @version 0.1.2 05.05.2011
2011-05-01 20:50:50 +03:00
*
*/
require_once dirname(__FILE__) . '/NCL/NCLNameCaseCore.php';
2011-05-01 20:50:50 +03:00
2011-06-28 11:51:03 +03:00
class NCLNameCaseRu extends NCLNameCaseCore implements NCLNameCaseInterface
2011-05-01 20:50:50 +03:00
{
/*
2011-06-28 11:51:03 +03:00
* @static string
* Количество падежов
2011-05-01 20:50:50 +03:00
*/
2011-06-28 11:51:03 +03:00
protected $CaseCount = 6;
2011-05-01 20:50:50 +03:00
/*
* @static string
* Список гласных
*/
private $vowels = "аеёиоуыэюя";
/*
* @static string
* Список согласных
*/
private $consonant = "бвгджзйклмнпрстфхцчшщ";
/*
* @static array()
* Список окончание для неизменяемых имен
*/
private $ovo = array('ово', 'аго', 'яго', 'ирь');
/*
* @static array()
* Список окончание для неизменяемых имен
*/
private $ih = array('их', 'ых', 'ко');
/*
* Функция, которая склоняет имя записаное в $this->firstName, по правилам склонения мужских имен.
*
* @return boolean
*/
2011-06-28 11:51:03 +03:00
protected function manFirstName()
2011-05-01 20:50:50 +03:00
{
//Последний символ
$LastSymbol = mb_substr($this->firstName, -1, 1, 'utf-8');
//Предпоследний символ
$BeforeLast = mb_substr($this->firstName, -2, 1, 'utf-8');
$needToChange = true;
$this->firstResult = array();
//Не склоняются
//Мужские и женские имена, оканчивающиеся на гласный звук исключая -а, -я
if ($this->in($LastSymbol, $this->vowels) and !$this->in($LastSymbol, 'ая'))
{
$needToChange = false;
$this->error = 3;
}
//Если нужно склонять
if ($needToChange)
{
//Мужские имена, оканчивающиеся на любой согласный (твердый или мягкий) и на -й, скло­няются так же, как обычные существительные мужского рода
if ($this->in($LastSymbol, $this->consonant) or
($LastSymbol == "ь" and $this->in($BeforeLast, $this->consonant)))
{
//если на й или ь
if ($this->in($LastSymbol, 'ьй'))
{
if ($BeforeLast <> "и")
{
$this->firstResult = $this->padeg($this->firstName, array('я', 'ю', 'я', 'ем', 'е'), true);
$this->frule = 1;
return true;
}
else
{
$this->firstResult = $this->padeg($this->firstName, array('я', 'ю', 'я', 'ем', 'и'), true);
$this->frule = 10;
return true;
}
}
else
{
if ($this->firstName == "Павел")
{
$this->firstResult = array("Павел", "Павла", "Павлу", "Павла", "Павлом", "Павле");
$this->frule = 200;
return true;
}
elseif ($this->firstName == "Лев")
{
$this->firstResult = array("Лев", "Льва", "Льву", "Льва", "Львом", "Льве");
$this->frule = 201;
return true;
}
else
{
$this->firstResult = $this->padeg($this->firstName, array('а', 'у', 'а', 'ом', 'е'), false);
$this->frule = 2;
return true;
}
}
}
//Мужские и женские имена, оканчивающиеся на -а, склоняются, как и любые существительные с таким же окончанием
elseif ($LastSymbol == "а")
{
if ($BeforeLast <> 'к')
{
$this->firstResult = $this->padeg($this->firstName, array('ы', 'е', 'у', 'ой', 'е'), true);
$this->frule = 3;
return true;
}
else
{
$this->firstResult = $this->padeg($this->firstName, array('и', 'е', 'у', 'ой', 'е'), true);
$this->frule = 15;
return true;
}
}
//Мужские и женские имена, оканчивающиеся иа -я, -ья, -ия, -ея, независимо от языка, из которого они происходят, склоняются как сущест­вительные с соответствующими окончаниями
elseif ($LastSymbol == "я")
{
$this->firstResult = $this->padeg($this->firstName, array('и', 'е', 'ю', 'ей', 'е'), true);
$this->frule = 4;
return true;
}
}
//Если правило не нашли, тогда оставляем как было
if (!isset($this->firstResult[0]))
{
$this->makeFirstTheSame();
return false;
}
}
/*
* Функция, которая склоняет имя записаное в $this->firstName, по правилам склонения женских имен.
*
* @return boolean
*/
2011-06-28 11:51:03 +03:00
protected function womanFirstName()
2011-05-01 20:50:50 +03:00
{
//Последний символ
$LastSymbol = mb_substr($this->firstName, -1, 1, 'utf-8');
//Предпоследний символ
$BeforeLast = mb_substr($this->firstName, -2, 1, 'utf-8');
$needToChange = true;
$this->firstResult = array();
//Не склоняются
//Женские имена, оканчивающиеся на согласный звук
if ($this->in($LastSymbol, $this->consonant))
{
$needToChange = false;
$this->error = 2;
}
//Мужские и женские имена, оканчивающиеся на гласный звук исключая -а, -я
if ($this->in($LastSymbol, $this->vowels) and !$this->in($LastSymbol, 'ая'))
{
$needToChange = false;
$this->error = 3;
}
//Если нужно склонять
if ($needToChange)
{
//Мужские и женские имена, оканчивающиеся на -а, склоняются, как и любые существительные с таким же окончанием
if ($LastSymbol == "а")
{
if (!$this->in($BeforeLast, 'шхкг'))
{
$this->firstResult = $this->padeg($this->firstName, array('ы', 'е', 'у', 'ой', 'е'), true);
$this->frule = 3;
return true;
}
else
{
//ей посля шиплячего
if ($BeforeLast == 'ш')
{
$this->firstResult = $this->padeg($this->firstName, array('и', 'е', 'у', 'ей', 'е'), true);
$this->frule = 25;
return true;
}
else
{
$this->firstResult = $this->padeg($this->firstName, array('и', 'е', 'у', 'ой', 'е'), true);
$this->frule = 15;
return true;
}
}
}
//Мужские и женские имена, оканчивающиеся иа -я, -ья, -ия, -ея, независимо от языка, из которого они происходят, склоняются как сущест­вительные с соответствующими окончаниями
elseif ($LastSymbol == "я")
{
if ($BeforeLast <> "и")
{
$this->firstResult = $this->padeg($this->firstName, array('и', 'е', 'ю', 'ей', 'е'), true);
$this->frule = 5;
return true;
}
else
{
$this->firstResult = $this->padeg($this->firstName, array('и', 'и', 'ю', 'ей', 'и'), true);
$this->frule = 8;
return true;
}
}
//Русские женские имена, оканчивающиеся на мягкий согласный, склоняются, как существительные женского рода типа дочь, тень
elseif ($LastSymbol == "ь")
{
$this->firstResult = $this->padeg($this->firstName, array('и', 'и', 'ь', 'ью', 'и'), true);
$this->frule = 6;
return true;
}
}
//Если правило не нашли, тогда оставляем как было
if (!isset($this->firstResult[0]))
{
$this->makeFirstTheSame();
return false;
}
}
/*
* Функция, которая склоняет фамилию записаное в $this->secondName, по правилам склонения мужских фамилий.
*
* @return boolean
*/
2011-06-28 11:51:03 +03:00
protected function manSecondName()
2011-05-01 20:50:50 +03:00
{
//Последний символ
$LastSymbol = mb_substr($this->secondName, -1, 1, 'utf-8');
//Предпоследний символ
$BeforeLast = mb_substr($this->secondName, -2, 1, 'utf-8');
$needToChange = true;
$this->secondResult = array();
//Не склоняются
//Фамилии на -а, -я с предшествующим гласным -и
if ($this->in($LastSymbol, 'ая') and $BeforeLast == "и")
{
$needToChange = false;
$this->error = 4;
}
/* Русские фамилии, представляющие собой застывшие формы родительного падежа единственного числа с окончаниями: -ово, -аго, -яго (Дурново, Сухово, Живаго, Шамбинаго, Дебяго, Хитрово) и множественного числа с окончаниями: -их, -ых (Крученых, Островских, Польских, Долгих, Седых), + украинские на ко */
if (in_array(mb_substr($this->secondName, -3, 3, 'utf-8'), $this->ovo) or in_array(mb_substr($this->secondName, -2, 2, 'utf-8'), $this->ih))
{
$needToChange = false;
$this->error = 5;
}
//Если нужно склонять
if ($needToChange)
{
//Мужские фамилии, оканчивающиеся на любой согласный (твердый или мягкий) и на -й, скло­няются так же, как обычные существительные мужского рода
if ($this->in($LastSymbol, $this->consonant) or
($LastSymbol == "ь" and $this->in($BeforeLast, $this->consonant)))
{
//если на й или ь
if ($this->in($LastSymbol, 'ьй'))
{
if ((mb_substr($this->secondName, -3, 1, 'utf-8') == "а") or $BeforeLast == 'е')
{
$this->srule = 101;
$this->secondResult = $this->padeg($this->secondName, array('я', 'ю', 'я', 'ем', 'е'), true);
return true;
}
//Толстой -» ТолстЫм
elseif ($BeforeLast == 'ы' or mb_substr($this->secondName, -3, 1, 'utf-8') == 'т')
{
$this->secondResult = $this->padeg($this->secondName, array('ого', 'ому', 'ого', 'ым', 'ом'), true, true);
$this->srule = 102;
return true;
}
//Лесничий
elseif ((mb_substr($this->secondName, -3, 3, 'utf-8')) == 'чий')
{
$this->secondResult = $this->padeg($this->secondName, array('ьего', 'ьему', 'ьего', 'ьим', 'ьем'), true, true);
$this->srule = 103;
return true;
}
else
{
$this->secondResult = $this->padeg($this->secondName, array('ого', 'ому', 'ого', 'им', 'ом'), true, true);
$this->srule = 1;
return true;
}
}
else
{
//Если предпоследняя к, то нужно ом вместо ым
if ($this->in($LastSymbol, 'к'))
{
//Если перед слово на ок, то нужно убрать о
if ($this->in($BeforeLast, 'о'))
{
$this->secondResult = $this->padeg($this->secondName, array('ка', 'ку', 'ка', 'ком', 'ке'), false, true);
$this->srule = 2301;
return true;
}
if ($this->in($BeforeLast, 'е'))
{
$this->secondResult = $this->padeg($this->secondName, array('ька', 'ьку', 'ька', 'ьком', 'ьке'), false, true);
$this->srule = 2302;
return true;
}
else
{
$this->secondResult = $this->padeg($this->secondName, array('а', 'у', 'а', 'ом', 'е'), false);
$this->srule = 23;
return true;
}
}
else
{
//Если основа на ч, то нужно ем
if ($LastSymbol == 'ч')
{
$this->secondResult = $this->padeg($this->secondName, array('а', 'у', 'а', 'ем', 'е'), false);
$this->srule = 301;
return true;
}
2011-06-28 11:51:03 +03:00
elseif ($this->in($LastSymbol, 'р'))
{
$this->secondResult = $this->padeg($this->secondName, array('а', 'у', 'а', 'ом', 'е'), false);
$this->srule = 302;
return true;
}
2011-05-01 20:50:50 +03:00
else
{
$this->secondResult = $this->padeg($this->secondName, array('а', 'у', 'а', 'ым', 'е'), false);
$this->srule = 3;
return true;
}
}
}
}
//Мужские и женские имена, оканчивающиеся на -а, склоняются, как и любые существительные с таким же окончанием
elseif ($LastSymbol == "а")
{
//Если основа на ш, то нужно и, ей
if ($this->in($BeforeLast, 'ш'))
{
$this->secondResult = $this->padeg($this->secondName, array('и', 'е', 'у', 'ей', 'е'), true);
$this->srule = 401;
return true;
}
elseif ($this->in($BeforeLast, 'хк'))
{
$this->secondResult = $this->padeg($this->secondName, array('и', 'е', 'у', 'ой', 'е'), true);
$this->srule = 402;
return true;
}
else
{
$this->secondResult = $this->padeg($this->secondName, array('ы', 'е', 'у', 'ой', 'е'), true);
$this->srule = 4;
return true;
}
}
//Мужские и женские имена, оканчивающиеся иа -я, -ья, -ия, -ея, независимо от языка, из которого они происходят, склоняются как сущест­вительные с соответствующими окончаниями
elseif ($LastSymbol == "я")
{
$this->secondResult = $this->padeg($this->secondName, array('ой', 'ой', 'ую', 'ой', 'ой'), true, true);
$this->srule = 6;
return true;
}
}
//Если правило не нашли, тогда оставляем как было
if (!isset($this->secondResult[0]))
{
$this->makeSecondTheSame();
return false;
}
}
/*
* Функция, которая склоняет фамилию записаное в $this->secondName, по правилам склонения женских фамилий.
*
* @return boolean
*/
2011-06-28 11:51:03 +03:00
protected function womanSecondName()
2011-05-01 20:50:50 +03:00
{
//Последний символ
$LastSymbol = mb_substr($this->secondName, -1, 1, 'utf-8');
//Предпоследний символ
$BeforeLast = mb_substr($this->secondName, -2, 1, 'utf-8');
$needToChange = true;
$this->secondResult = array();
//Не склоняются
//Женские фамилии, оканчивающиеся на согласный звук и мягкий знак
if ($this->in($LastSymbol, $this->consonant) or $LastSymbol == 'ь')
{
$needToChange = false;
$this->error = 1;
}
//Фамилии на -а, -я с предшествующим гласным -и
if ($this->in($LastSymbol, 'ая') and $BeforeLast == "и")
{
$needToChange = false;
$this->error = 4;
}
/* Русские фамилии, представляющие собой застывшие формы родительного падежа единственного числа с окончаниями: -ово, -аго, -яго (Дурново, Сухово, Живаго, Шамбинаго, Дебяго, Хитрово) и множественного числа с окончаниями: -их, -ых (Крученых, Островских, Польских, Долгих, Седых), + украинские на ко */
if (in_array(mb_substr($this->secondName, -3, 3, 'utf-8'), $this->ovo) or in_array(mb_substr($this->secondName, -2, 2, 'utf-8'), $this->ih))
{
$needToChange = false;
$this->error = 5;
}
//Если нужно склонять
if ($needToChange)
{
//Мужские и женские имена, оканчивающиеся на -а, склоняются, как и любые существительные с таким же окончанием
if ($LastSymbol == "а")
{
if ($this->in($BeforeLast, 'гк'))
{
$this->secondResult = $this->padeg($this->secondName, array('и', 'е', 'у', 'ой', 'е'), true);
$this->srule = 501;
return true;
}
elseif ($this->in($BeforeLast, 'ш'))
{
$this->secondResult = $this->padeg($this->secondName, array('и', 'е', 'у', 'ей', 'е'), true);
$this->srule = 502;
return true;
}
else
{
$this->secondResult = $this->padeg($this->secondName, array('ой', 'ой', 'у', 'ой', 'ой'), true);
$this->srule = 5;
return true;
}
}
//Мужские и женские имена, оканчивающиеся иа -я, -ья, -ия, -ея, независимо от языка, из которого они происходят, склоняются как сущест­вительные с соответствующими окончаниями
elseif ($LastSymbol == "я")
{
$this->secondResult = $this->padeg($this->secondName, array('ой', 'ой', 'ую', 'ой', 'ой'), true, true);
$this->srule = 6;
return true;
}
}
//Если правило не нашли, тогда оставляем как было
if (!isset($this->secondResult[0]))
{
$this->makeSecondTheSame();
return false;
}
}
/*
* Функция, которая склоняет отчество записаное в $this->secondName, по правилам склонения мужских отчеств.
*
* @return boolean
*/
2011-06-28 11:51:03 +03:00
protected function manFatherName()
2011-05-01 20:50:50 +03:00
{
//Проверяем действительно ли отчество
if ($this->fatherName == 'Ильич')
{
$this->fatherResult = $this->padeg($this->fatherName, array('а', 'у', 'а', 'ом', 'е'), false, false);
return true;
}
elseif (mb_substr($this->fatherName, -2, 2, 'utf-8') == 'ич')
{
$this->fatherResult = $this->padeg($this->fatherName, array('а', 'у', 'а', 'ем', 'е'), false, false);
return true;
}
else
{
$this->makeFatherTheSame();
return false;
}
}
/*
* Функция, которая склоняет отчество записаное в $this->fatherName, по правилам склонения женских отчеств.
*
* @return boolean
*/
2011-06-28 11:51:03 +03:00
protected function womanFatherName()
2011-05-01 20:50:50 +03:00
{
//Проверяем действительно ли отчество
if (mb_substr($this->fatherName, -2, 2, 'utf-8') == 'на')
{
$this->fatherResult = $this->padeg($this->fatherName, array('ы', 'е', 'у', 'ой', 'е'), true, false);
return true;
}
else
{
$this->makeFatherTheSame();
return false;
}
}
/*
* Автоматическое определение пола
* @return void
*/
2011-06-28 11:51:03 +03:00
protected function genderDetect()
2011-05-01 20:50:50 +03:00
{
if (!$this->gender)
{
//Определение пола по отчеству
if (isset($this->fatherName) and $this->fatherName)
{
$LastTwo = mb_substr($this->fatherName, -2, 2, 'utf-8');
if ($LastTwo == 'ич')
{
2011-06-28 11:51:03 +03:00
$this->gender = NCL::$MAN; // мужчина
return true;
}
if ($LastTwo == 'на')
{
2011-06-28 11:51:03 +03:00
$this->gender = NCL::$WOMAN; // женщина
return true;
}
}
$man = 0; //Мужчина
$woman = 0; //Женщина
$FLastSymbol = mb_substr($this->firstName, -1, 1, 'utf-8');
$FLastTwo = mb_substr($this->firstName, -2, 2, 'utf-8');
$FLastThree = mb_substr($this->firstName, -3, 3, 'utf-8');
$FLastFour = mb_substr($this->firstName, -4, 4, 'utf-8');
$SLastSymbol = mb_substr($this->secondName, -1, 1, 'utf-8');
$SLastTwo = mb_substr($this->secondName, -2, 2, 'utf-8');
$SLastThree = mb_substr($this->secondName, -3, 3, 'utf-8');
//Если нет отчества, то определяем по имени и фамилии, будем считать вероятность
if (isset($this->firstName) and $this->firstName)
{
//Попробуем выжать максимум из имени
//Если имя заканчивается на й, то скорее всего мужчина
if ($FLastSymbol == 'й')
{
$man+=0.9;
}
if (in_array($FLastTwo, array('он', 'ов', 'ав', 'ам', 'ол', 'ан', 'рд', 'мп')))
{
$man+=0.3;
}
if ($this->in($FLastSymbol, $this->consonant))
{
$man+=0.01;
}
if ($FLastSymbol == 'ь')
{
$man+=0.02;
}
if (in_array($FLastTwo, array('вь', 'фь', 'ль')))
{
$woman+=0.1;
}
if (in_array($FLastTwo, array('ла')))
{
$woman+=0.04;
}
if (in_array($FLastTwo, array('то', 'ма')))
{
$man+=0.01;
}
if (in_array($FLastThree, array('лья', 'вва', 'ока', 'ука', 'ита')))
{
$man+=0.2;
}
if (in_array($FLastThree, array('има')))
{
$woman+=0.15;
}
if (in_array($FLastThree, array('лия', 'ния', 'сия', 'дра', 'лла', 'кла')))
{
$woman+=0.5;
}
if (in_array($FLastFour, array('льда', 'фира', 'нина', 'лита')))
{
$woman+=0.5;
}
}
if (isset($this->secondName) and $this->secondName)
{
if (in_array($SLastTwo, array('ов', 'ин', 'ев', 'ий', 'ёв', 'ый', 'ын', 'ой')))
{
$man+=0.4;
}
if (in_array($SLastThree, array('ова', 'ина', 'ева', 'ёва', 'ына')))
{
$woman+=0.4;
}
if (in_array($SLastTwo, array('ая')))
{
$woman+=0.4;
}
}
//Теперь смотрим, кто больше набрал
if ($man > $woman)
{
2011-06-28 11:51:03 +03:00
$this->gender = NCL::$MAN;
}
else
{
2011-06-28 11:51:03 +03:00
$this->gender = NCL::$WOMAN;
}
2011-05-01 20:50:50 +03:00
}
}
/*
* Определение текущее слово есть фамилией, именем или отчеством
* @return integer $number - 1-фамили 2-имя 3-отчество
*/
2011-06-28 11:51:03 +03:00
protected function detectNamePart($namepart)
{
$LastSymbol = mb_substr($namepart, -1, 1, 'utf-8');
$LastTwo = mb_substr($namepart, -2, 2, 'utf-8');
$LastThree = mb_substr($namepart, -3, 3, 'utf-8');
$LastFour = mb_substr($namepart, -4, 4, 'utf-8');
//Считаем вероятность
$first = 0;
$second = 0;
$father = 0;
//если смахивает на отчество
if (in_array($LastThree, array('вна', 'чна', 'вич', 'ьич')))
{
$father+=3;
}
//Похоже на имя
if (in_array($LastThree, array('тин', 'тын')))
{
$first+=0.5;
}
//Исключения
if (in_array($namepart, array('Лев', 'Яков', 'Мальвина', 'Антонина', 'Альбина', 'Агриппина', 'Каллиник', 'Маша', 'Ольга', 'Еремей', 'Фаина', 'Лазарь', 'Екатерина', 'Карина', 'Марина', 'Валентина', 'Кристина', 'Исак', 'Исаак', 'Валентин', 'Константин', 'Мартин', 'Устин', 'Калина', 'Аделина', 'Алина', 'Ангелина', 'Галина', 'Каролина', 'Павлина', 'Полина', 'Элина', 'Мина', 'Нина')))
{
$first+=10;
}
//похоже на фамилию
2011-06-28 11:51:03 +03:00
if (in_array($LastTwo, array('ов', 'ин', 'ев', 'ёв', 'ый', 'ын', 'ой', 'ко', 'ук', 'як', 'ца', 'их', 'ик', 'ун', 'ок', 'ша', 'ая', 'га', 'ёк', 'аш', 'ив', 'юк', 'ус', 'це', 'ак', 'бр', 'яр')))
{
$second+=0.4;
}
if (in_array($LastThree, array('ова', 'ева', 'ёва', 'ына', 'тых', 'рик', 'вач', 'аха', 'шен', 'мей', 'арь', 'вка', 'шир', 'бан', 'тин', 'чий', 'ина')))
{
$second+=0.4;
}
if (in_array($LastFour, array('ьник', 'нчук', 'тник', 'кирь', 'ский', 'шена')))
{
$second+=0.4;
}
$max = max(array($first, $second, $father));
if ($first == $max)
{
return 'N';
}
elseif ($second == $max)
{
return 'S';
}
else
{
return 'F';
}
}
2011-05-01 20:50:50 +03:00
}
?>