Это не «миф» - есть обширная литература на эту тему, основные авторы Лауфер и Нейшен. Тут надо немного различить о чем суть. 1500-2000 не слов, а продуктивных корней, если точнее - что леммами получается 5-7 тыс слов, см. пример с итальянским глаголом fondare выше. Я свои слова назад не беру - освоение этого с лихвой хватит, чтобы выразить себя на произвольную тему, с учетом, что корни должны быть не рандомные, а частотные.
А вот для потребления продукции на таргет-языке с покрытием лексическим 98% нужно 7-8 тыс корней. В таком случае понятие неизвестных слов происходит по контексту, собственно сами нативы аналогично читают худлит. Стандартизированные тесты на понятие содержания дают 70% понятие, что очень достойный результат, у самих нативов по этому тесту ~80% понятие