feature namecase. Склонение составных фамилий ( Салтыков-Щедрин )

This commit is contained in:
RA 2015-07-31 22:19:21 +03:00
parent 08261c807d
commit b95e99f860
2 changed files with 1441 additions and 1382 deletions

File diff suppressed because it is too large Load Diff

View File

@ -6,7 +6,7 @@
/** /**
* NCLNameCaseWord - класс, который служит для хранения всей информации о каждом слове * NCLNameCaseWord - класс, который служит для хранения всей информации о каждом слове
* *
* @author Андрей Чайка <bymer3@gmail.com> * @author Андрей Чайка <bymer3@gmail.com>
* @version 0.4.1 * @version 0.4.1
* @package NameCaseLib * @package NameCaseLib
@ -14,282 +14,298 @@
class NCLNameCaseWord class NCLNameCaseWord
{ {
/** /**
* Слово в нижнем регистре, которое хранится в об’єкте класса * Слово в нижнем регистре, которое хранится в об’єкте класса
* @var string * @var string
*/ */
private $word = ''; private $word = '';
/**
* Тип текущей записи (Фамилия/Имя/Отчество)
* - <b>N</b> - ім’я
* - <b>S</b> - прізвище
* - <b>F</b> - по-батькові
* @var string
*/
private $namePart = null;
/**
* Вероятность того, что текущей слово относится к мужскому полу
* @var int
*/
private $genderMan = 0;
/**
* Вероятность того, что текущей слово относится к женскому полу
* @var int
*/
private $genderWoman = 0;
/**
* Окончательное решение, к какому полу относится слово
* - 0 - не определено
* - NCL::$MAN - мужской пол
* - NCL::$WOMAN - женский пол
* @var int
*/
private $genderSolved = 0;
/**
* Маска больших букв в слове.
*
* Содержит информацию о том, какие буквы в слове были большими, а какие мальникими:
* - x - маленькая буква
* - X - больная буква
* @var array
*/
private $letterMask = array();
/**
* Содержит true, если все слово было в верхнем регистре и false, если не было
* @var bool
*/
private $isUpperCase = false;
/**
* Массив содержит все падежи слова, полученые после склонения текущего слова
* @var array
*/
private $NameCases = array();
/**
* Номер правила, по которому было произведено склонение текущего слова
* @var int
*/
private $rule = 0;
/**
* Создание нового обьекта со словом <var>$word</var>
* @param string $word слово
*/
public function __construct($word)
{
$this->generateMask($word);
$this->word = NCLStr::strtolower($word);
}
/**
* Генерирует маску, которая содержит информацию о том, какие буквы в слове были большими, а какие маленькими:
* - x - маленькая буква
* - X - больная буква
* @param string $word слово, для которого генерировать маску
*/
private function generateMask($word)
{
$letters = NCLStr::splitLetters($word);
$mask = array();
$this->isUpperCase = true;
foreach ($letters as $letter)
{
if (NCLStr::isLowerCase($letter))
{
$mask[] = 'x';
$this->isUpperCase = false;
}
else
{
$mask[] = 'X';
}
}
$this->letterMask = $mask;
}
/**
* Возвращает все падежи слова в начальную маску:
* - x - маленькая буква
* - X - больная буква
*/
private function returnMask()
{
if ($this->isUpperCase)
{
foreach ($this->NameCases as $index => $case)
{
$this->NameCases[$index] = NCLStr::strtoupper($this->NameCases[$index]);
}
}
else
{
$splitedMask = $this->letterMask;
$maskLength = count($splitedMask);
foreach ($this->NameCases as $index => $case)
{
$caseLength = NCLStr::strlen($case);
$max = min(array($caseLength, $maskLength)); /**
$this->NameCases[$index] = ''; * Оригинальное слово
for ($letterIndex = 0; $letterIndex < $max; $letterIndex++) * @var string
{ */
$letter = NCLStr::substr($case, $letterIndex, 1); private $word_orig = '';
if ($splitedMask[$letterIndex] == 'X')
{ /**
$letter = NCLStr::strtoupper($letter); * Тип текущей записи (Фамилия/Имя/Отчество)
} * - <b>N</b> - ім’я
$this->NameCases[$index] .= $letter; * - <b>S</b> - прізвище
} * - <b>F</b> - по-батькові
$this->NameCases[$index] .= NCLStr::substr($case, $max, $caseLength-$maskLength); * @var string
} */
} private $namePart = null;
}
/**
/** * Вероятность того, что текущей слово относится к мужскому полу
* Сохраняет результат склонения текущего слова * @var int
* @param array $nameCases массив со всеми падежами */
*/ private $genderMan = 0;
public function setNameCases($nameCases)
{ /**
$this->NameCases = $nameCases; * Вероятность того, что текущей слово относится к женскому полу
$this->returnMask(); * @var int
} */
private $genderWoman = 0;
/**
* Возвращает массив со всеми падежами текущего слова /**
* @return array массив со всеми падежами * Окончательное решение, к какому полу относится слово
*/ * - 0 - не определено
public function getNameCases() * - NCL::$MAN - мужской пол
{ * - NCL::$WOMAN - женский пол
return $this->NameCases; * @var int
} */
private $genderSolved = 0;
/**
* Возвращает строку с нужным падежом текущего слова /**
* @param int $number нужный падеж * Маска больших букв в слове.
* @return string строка с нужным падежом текущего слова *
*/ * Содержит информацию о том, какие буквы в слове были большими, а какие мальникими:
public function getNameCase($number) * - x - маленькая буква
{ * - X - больная буква
if(isset($this->NameCases[$number])) * @var array
{ */
return $this->NameCases[$number]; private $letterMask = array();
}
return false; /**
} * Содержит true, если все слово было в верхнем регистре и false, если не было
* @var bool
/** */
* Расчитывает и возвращает пол текущего слова private $isUpperCase = false;
* @return int пол текущего слова
*/ /**
public function gender() * Массив содержит все падежи слова, полученые после склонения текущего слова
{ * @var array
if (!$this->genderSolved) */
{ private $NameCases = array();
if ($this->genderMan > $this->genderWoman)
{ /**
$this->genderSolved = NCL::$MAN; * Номер правила, по которому было произведено склонение текущего слова
} * @var int
else */
{ private $rule = 0;
$this->genderSolved = NCL::$WOMAN;
} /**
} * Создание нового обьекта со словом <var>$word</var>
return $this->genderSolved; * @param string $word слово
} */
public function __construct($word)
/** {
* Устанавливает вероятности того, что даное слово является мужчиной или женщиной $this->word_orig=$word;
* @param int $man вероятность того, что слово мужчина $this->generateMask($word);
* @param int $woman верятность того, что слово женщина $this->word = NCLStr::strtolower($word);
*/ }
public function setGender($man, $woman)
{ /**
$this->genderMan = $man; * Генерирует маску, которая содержит информацию о том, какие буквы в слове были большими, а какие маленькими:
$this->genderWoman = $woman; * - x - маленькая буква
} * - X - больная буква
* @param string $word слово, для которого генерировать маску
/** */
* Окончательно устанавливает пол человека private function generateMask($word)
* - 0 - не определено {
* - NCL::$MAN - мужчина $letters = NCLStr::splitLetters($word);
* - NCL::$WOMAN - женщина $mask = array();
* @param int $gender пол человека $this->isUpperCase = true;
*/ foreach ($letters as $letter)
public function setTrueGender($gender) {
{ if (NCLStr::isLowerCase($letter))
$this->genderSolved = $gender; {
} $mask[] = 'x';
$this->isUpperCase = false;
/** }
* Возвращает массив вероятности того, что даное слово является мужчиной или женщиной else
* @return array массив вероятностей {
*/ $mask[] = 'X';
public function getGender() }
{ }
return array(NCL::$MAN => $this->genderMan, NCL::$WOMAN => $this->genderWoman); $this->letterMask = $mask;
} }
/** /**
* Устанавливает тип текущего слова * Возвращает все падежи слова в начальную маску:
* <b>Тип слова:</b> * - x - маленькая буква
* - S - Фамилия * - X - больная буква
* - N - Имя */
* - F - Отчество private function returnMask()
* @param string $namePart тип слова {
*/ if ($this->isUpperCase)
public function setNamePart($namePart) {
{ foreach ($this->NameCases as $index => $case)
$this->namePart = $namePart; {
} $this->NameCases[$index] = NCLStr::strtoupper($this->NameCases[$index]);
}
/** }
* Возвращает тип текущего слова else
* <b>Тип слова:</b> {
* - S - Фамилия $splitedMask = $this->letterMask;
* - N - Имя $maskLength = count($splitedMask);
* - F - Отчество foreach ($this->NameCases as $index => $case)
* @return string $namePart тип слова {
*/ $caseLength = NCLStr::strlen($case);
public function getNamePart()
{ $max = min(array($caseLength, $maskLength));
return $this->namePart; $this->NameCases[$index] = '';
} for ($letterIndex = 0; $letterIndex < $max; $letterIndex++)
{
/** $letter = NCLStr::substr($case, $letterIndex, 1);
* Возвращает текущее слово. if ($splitedMask[$letterIndex] == 'X')
* @return string текущее слово {
*/ $letter = NCLStr::strtoupper($letter);
public function getWord() }
{ $this->NameCases[$index] .= $letter;
return $this->word; }
} $this->NameCases[$index] .= NCLStr::substr($case, $max, $caseLength-$maskLength);
}
/** }
* Если уже был расчитан пол для всех слов системы, тогда каждому слову предается окончательное }
* решение. Эта функция определяет было ли принято окончательное решение.
* @return bool было ли принято окончательное решение по поводу пола текущего слова /**
*/ * Сохраняет результат склонения текущего слова
public function isGenderSolved() * @param array $nameCases массив со всеми падежами
{ */
return ($this->genderSolved ? true : false); public function setNameCases($nameCases, $is_return_mask=true)
} {
$this->NameCases = $nameCases;
/** if ($is_return_mask) $this->returnMask();
* Устанавливает номер правила по которому склонялось текущее слово. }
* @param int $ruleID номер правила
*/ /**
public function setRule($ruleID) * Возвращает массив со всеми падежами текущего слова
{ * @return array массив со всеми падежами
$this->rule = $ruleID; */
} public function getNameCases()
{
return $this->NameCases;
}
/**
* Возвращает строку с нужным падежом текущего слова
* @param int $number нужный падеж
* @return string строка с нужным падежом текущего слова
*/
public function getNameCase($number)
{
if(isset($this->NameCases[$number]))
{
return $this->NameCases[$number];
}
return false;
}
/**
* Расчитывает и возвращает пол текущего слова
* @return int пол текущего слова
*/
public function gender()
{
if (!$this->genderSolved)
{
if ($this->genderMan > $this->genderWoman)
{
$this->genderSolved = NCL::$MAN;
}
else
{
$this->genderSolved = NCL::$WOMAN;
}
}
return $this->genderSolved;
}
/**
* Устанавливает вероятности того, что даное слово является мужчиной или женщиной
* @param int $man вероятность того, что слово мужчина
* @param int $woman верятность того, что слово женщина
*/
public function setGender($man, $woman)
{
$this->genderMan = $man;
$this->genderWoman = $woman;
}
/**
* Окончательно устанавливает пол человека
* - 0 - не определено
* - NCL::$MAN - мужчина
* - NCL::$WOMAN - женщина
* @param int $gender пол человека
*/
public function setTrueGender($gender)
{
$this->genderSolved = $gender;
}
/**
* Возвращает массив вероятности того, что даное слово является мужчиной или женщиной
* @return array массив вероятностей
*/
public function getGender()
{
return array(NCL::$MAN => $this->genderMan, NCL::$WOMAN => $this->genderWoman);
}
/**
* Устанавливает тип текущего слова
* <b>Тип слова:</b>
* - S - Фамилия
* - N - Имя
* - F - Отчество
* @param string $namePart тип слова
*/
public function setNamePart($namePart)
{
$this->namePart = $namePart;
}
/**
* Возвращает тип текущего слова
* <b>Тип слова:</b>
* - S - Фамилия
* - N - Имя
* - F - Отчество
* @return string $namePart тип слова
*/
public function getNamePart()
{
return $this->namePart;
}
/**
* Возвращает текущее слово.
* @return string текущее слово
*/
public function getWord()
{
return $this->word;
}
/**
* Возвращает текущее оригинальное слово.
* @return string текущее слово
*/
public function getWordOrig()
{
return $this->word_orig;
}
/**
* Если уже был расчитан пол для всех слов системы, тогда каждому слову предается окончательное
* решение. Эта функция определяет было ли принято окончательное решение.
* @return bool было ли принято окончательное решение по поводу пола текущего слова
*/
public function isGenderSolved()
{
return ($this->genderSolved ? true : false);
}
/**
* Устанавливает номер правила по которому склонялось текущее слово.
* @param int $ruleID номер правила
*/
public function setRule($ruleID)
{
$this->rule = $ruleID;
}
} }
?> ?>