В словаре мы можем определить слово через набор других. Также как и какие-то теоремы в математике через набор аксиом. Так вот, существует ли в каком-то языке минимальный базис слов, достаточных, чтобы определить все остальные? Сколько слов достаточно? Проводились ли какие-то исследования на эту тему?
somewhat relevant discussion
search for “What Really Lets ChatGPT Work?” section
Думаю, что лингвистически эта идея довольно близка
Each language’s translations of the semantic primes are called exponents. Below is a list of English exponents, or the English translation of the semantic primes. It is important to note that some of the exponents in the following list are polysemous and can be associated with meanings in English (and other languages) that are not shared. However, when used as an exponent in the Natural semantic metalanguage, it is only the prime concept which is identified as universal.
Надо учесть, что изначально речь идёт о количестве
нежели концептов.
Задание таковой формализации языка было бы легче, если бы язык был более прямолиненой системой — без той же полисемии или синонимов. Попытаться, несомненно, можно, но любая попытка собрания минимального репертуара не обойдется без определённых ограничений или условностей. Если на пути Вам попадётся последний лингвист-теоретик, то тот вовсе может начать спрашивать, что может быть включено в словарь языка, а что нет (эту задачу рассматривать не будем, но он тоже возможен). Бывало такое, что какое-нибудь слово «фрустрация» один носитель посчитает неуместным англицизмом, а другой – полноценным словом, и даже будет использовать в обиходе. Со сленгами ситуация еще интереснее. Еще один вопрос – насколько допустимы круговые определения в данном мини-словаре? Или определения, которые ссылаются друг на друга? Все усугубляется диахроничностью языка — будем ли включать такие слова, как забрало, базланить, или ледень, которые когда-то были частью повседневного русского?
Вот, например, как на схожий вопрос пытались ответить пользователи реддита 13 лет назад. Один пользователь выдал примерное значение в 4000 слов.
В принципе, компиляция подобного словаря — возможная затея, в зависимости от того, где и какие Вы поставите ограничения. Если еще что-то в голову взбредет или вспомнится, дополню.