Под полной мультиколлинеарностью понимается существование между некоторыми из факторов линейной функциональной связи. В практике статистических исследований полная мультиколлинеарность встречается достаточно редко, т.к. её несложно избежать уже на предварительной стадии анализа и отбора множества объясняющих переменных.
Реальная (или частичная) мультиколлинеарность возникает в случаях существования достаточно тесных линейных статистических связей между объясняющими переменными. Точных количественных критериев для определения наличия или отсутствия реальной мультиколлинеарности не существует.
Под мультиколлинеарностью понимается высокая взаимная коррелированность объясняющих переменных. Мультиколлинеарность может проявляться в функциональной (явной) и стохастической (скрытой) формах.
При функциональной форме мультиколлинеарности по крайней мере одна из парных связей между объясняющими переменными является линейной функциональной зависимостью. В этом случае матрица X`X особенная, так как содержит линейно зависимые векторы-столбцы, и её определитель равен нулю, т.е. нарушается предпосылка регрессионного анализа, это приводит к невозможности решения соответствующей системы нормальных уравнений и получения оценок параметров регрессионной модели.
Однако в экономических исследованиях мультиколлинеарность чаще проявляется в стохастической форме, когда между хотя бы двумя объясняющими переменными существует тесная корреляционная связь. Матрица X`X в этом случае является неособенной, но её определитель очень мал.
В то же время вектор оценок b и его ковариционная матрица ∑b пропорциональны обратной матрице (X`X) -1 , а значит, их элементы обратно пропорциональны величине определителя |X`X|. В результате получаются значительные средние квадратические отклонения (стандартные ошибки) коэффициентов регрессии b, b1,…,bp и оценка их значимости по t-критерию не имеет смысла, хотя в целом регрессионная модель может оказаться значимой по F-критерию.
Оценки становятся очень чувствительными к незначительному изменению результатов наблюдений и объёма выборки. Уравнения регрессии в этом случае, как правило, не имеют реального смысла, так как некоторые из его коэффициентов могут иметь неправильные с точки зрения экономической теории знаки и неоправданно большие значения.
Точных количественных критериев для определения наличия или отсутствия мультиколлинеарности не существует. Тем не менее, имеются некоторые эвристические подходы по её выявлению.
Один из таких подходов заключается в анализе корреляционной матрицы между объясняющими переменными X1,X2,…,Xp и выявлении пар переменных, имеющих высокие переменные корреляции (обычно больше 0,8). Если такие переменные существуют, говорят о мультиколлинеарности между ними. Полезно также находить множественные коэффициенты детерминации между одной из объясняющих переменных и некоторой группой из них. Наличие высокого множественного коэффициента детерминации (обычно больше 0,6) свидетельствует о мультиколлинеарности.
Другой подход состоит в исследовании матрицы X`X. Если определитель матрицы X`X либо её минимальное собственное значение λmin близки к нулю (например, одного порядка с накапливающимися ошибками вычислений), то это говорит о наличии мультиколлинеарности. О том же может свидетельствовать и значительное отклонение максимального собственного значения λmax матрицы X`X от её минимального собственного значения λmin.
Для устранения или уменьшения мультиколлинеарности используется ряд методов. Самый простой из них (но далеко не всегда возможный) состоит в том, что из двух объясняющих переменных, имеющих высокий коэффициент корреляции (больше 0,8), одну переменную исключают из рассмотрения. При этом, какую переменную оставить, а какую удалить из анализа, решают в первую очередь на основании экономических соображений. Если с экономической точки зрения ни одной из переменных нельзя отдать предпочтение, то оставляют ту из двух переменных, которая имеет больший коэффициент корреляции с зависимой переменной.
Другой метод устранения или уменьшения мультиколлинеарности заключается в переходе от несмещённых оценок, определённых по методу наименьших квадратов, к смещённым оценкам, обладающим, однако, меньшим рассеянием относительно оцениваемого параметра, т.е. меньшим математическим ожиданием квадрата отклонения оценки bj от параметра βj или M (bj— βj) 2 .
Оценки, определяемые вектором, обладают в соответствии с теоремой Гаусса-Маркова минимальными дисперсиями в классе всех линейных несмещённых оценок, но при наличии мультиколлинеарности эти дисперсии могут оказаться слишком большими, и обращение к соответствующим смещённым оценкам может повысить точность оценивания параметров регрессии. На рисунке показан случай, когда смещённая оценка βj ^ , выборочное распределение которой задаётся плотностью φ( βj ^ ).
Действительно, пусть максимально допустимый по величине доверительный интервал для оцениваемого параметра βjесть (βj-Δ, βj+Δ). Тогда доверительная вероятность, или надёжность оценки, определяемая площадью под кривой распределения на интервале (βj-Δ, βj+Δ), как нетрудно видеть из рисунка, будет в данном случае больше для оценки βjпо сравнению с bj ( на рисунке эти площади заштрихованы). Соответственно средний квадрат отклонения оценки от оцениваемого параметра будет меньше для смещённой оценки, т.е.:
При использовании «ридж-регрессии» (или «гребневой регрессии») вместо несмещённых оценок рассматривают смещённые оценки, задаваемые вектором
гдеτ –некоторое положительное число, называемое «гребнем» или «хребтом»,
Ep+1 – единичная матрица (р+1) –го порядка.
Добавление τк диагональным элементам матрицы X`X делает оценки параметров модели смещёнными, но при этом увеличивается определитель матрицы системы нормальных уравнений – вместо (X`X) от будет равен
Таким образом, становится возможным исключение мультиколлинеарности в случае, когда определитель |X`X| близок к нулю.
Для устранения мультиколлинеарности может быть использован переходот исходных объясняющих переменныхX1,X2,…,Xn, связанных между собой достаточно тесной корреляционной зависимостью, к новым переменным, представляющим линейные комбинации исходных. При этом новые переменные должны быть слабокоррелированными либо вообще некоррелированными. В качестве таких переменных берут, например, так называемые главные компоненты вектора исходных объясняющих переменных, изучаемые в компонентном анализе, и рассматривают регрессию на главных компонентах, в которой последние выступают в качестве обобщённых объясняющих переменных, подлежащих в дальнейшем содержательной (экономической) интерпретации.
Ортогональность главных компонент предотвращает проявление эффекта мультиколлинеарности. Кроме того, применяемый метод позволяет ограничиться малым числом главных компонент при сравнительно большом количестве исходных объясняющих переменных.
Мультиколлинеарность — это понятие, которое используется для описания проблемы, когда нестрогая линейная зависимость между объясняющими переменными приводит к получению ненадежных оценок регрессии. Разумеется, такая зависимость совсем необязательно дает неудовлетворительные оценки. Если все другие условия благоприятствуют, т. е. если число наблюдений и выборочные дисперсии объясняющих переменных велики, а дисперсия случайного члена мала, то в итоге можно получить вполне хорошие оценки.
Итак, мультиколлинеарность должна вызываться сочетанием нестрогой зависимости и одного (или более) неблагоприятного условия, и это — вопрос степени выраженности явления, а не его вида. Оценка любой регрессии будет страдать от нее в определенной степени, если только все независимые переменные не окажутся абсолютно некоррелированными. Рассмотрение данной проблемы начинается только тогда, когда это серьезно влияет на результаты оценки регрессии.
Эта проблема является обычной для регрессий временных рядов, т. е. когда данные состоят из ряда наблюдений в течение какого-то периода времени. Если две или более независимые переменные имеют ярко выраженный временной тренд, то они будут тесно коррелированы, и это может привести к мультиколлинеарности.
Перечислим основные последствия мультиколлинеарности:
1. Большие дисперсии оценок. Это затрудняет нахождение истинных значений определяемых величин и расширяет интервальные оценки, ухудшая их точность.
2. Уменьшаются t – статистики коэффициентов, что может привести к неоправданному выводу о несущественности влияния соответствующего фактора на зависимую переменную.
3. Оценки коэффициентов по МНК и их стандартные ошибки становятся очень чувствительными к малейшим изменениям данных, т.е. они становятся неустойчивыми.
4. Затрудняется определение вклада каждой из объясняющих переменных в объясняемую уравнением регрессии дисперсию зависимой переменной.
5. Возможно получение неверного знака у коэффициента регрессии.
Единого подхода к устранению мультиколлинеарности не существует. Существует ряд методов, которые не являются универсальными и применимы в конкретных ситуациях.
Простейшим методом устранения мультиколлинеарности является исключение из модели одной или нескольких коррелированных переменных. Здесь необходима осторожность, чтобы не отбросить переменную, которая необходима в модели по своей экономической сущности, но зачастую коррелирует с другими переменными (например, цена блага и цены заменителей данного блага).
Иногда для устранения мультиколлинеарности достаточно увеличить объем выборки. Например, при использовании ежегодных данных можно перейти к поквартальным данным. Это приведёт к сокращению дисперсии коэффициентов регрессии и увеличению их статистической значимости. Однако при этом можно усилить автокорреляцию, что ограничивает возможности такого подхода.
В некоторых случаях изменение спецификации модели, например, добавление существенного фактора, решает проблему мультиколлинеарности. При этом уменьшается остаточная СКО, что приводит к уменьшению стандартных ошибок коэффициентов.
В ряде случаев минимизировать либо вообще устранить проблему мультиколлинеарности можно с помощью преобразования переменных.
Теперь рассмотрим другой вопрос, имеющий важное значение для проблем, связанных со спецификацией модели множественной регрессии. Это частная корреляция. С помощью частных коэффициентов корреляции проводится ранжирование факторов по степени их влияния на результат. Кроме того, частные показатели корреляции широко используются при решении проблем отбора факторов: целесообразность включения того или иного фактора в модель доказывается величиной показателя частной корреляции.
Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при устранении влияния других факторов, включенных в уравнение регрессии.
Показатели частной корреляции представляют собой отношение сокращения остаточной дисперсии за счет дополнительного включения в модель нового фактора к остаточной дисперсии, имевшей место до введения его в модель.
Высокое значение коэффициента парной корреляции между исследуемой зависимой и какой – либо независимой переменной может означать высокую степень взаимосвязи, но может быть обусловлено и другой причиной, например, третьей переменной, которая оказывает сильное влияние на две первые, что и объясняет их высокую коррелированность. Поэтому возникает задача найти «чистую» корреляцию между двумя переменными, исключив (линейное) влияние других факторов. Это можно сделать с помощью коэффициента частной корреляции.
Коэффициенты частной корреляции определяются различными способами.
Теперь остановимся на специальных процедурах спецификации модели множественной регрессии, которые обычно называются процедурами пошагового отбора переменных.
Иногда исследователь заранее знает характер зависимости исследуемых величин, опираясь на экономическую теорию, предыдущие результаты или априорные знания, и его задача состоит лишь в оценивании неизвестных параметров. Классическим примером является оценивание параметров производственной функции Кобба – Дугласа, где заранее известно, что в качестве факторов выступают капиталовложения и трудозатраты.
Однако на практике чаще имеется большое число наблюдений различных независимых переменных, но нет априорной модели изучаемого явления. Возникает проблема, какие переменные включать в регрессионную схему.
В компьютерные пакеты включены различные эвристрические процедуры пошагового отбора факторов. Основными пошаговыми процедурами являются:
— процедура последовательного присоединения;
— процедура последовательного присоединения – удаления;
— процедура последовательного удаления.
Следует признать, что пошаговые процедуры, не гарантируют получения оптимального (в смысле критерия максимума коэффициента детерминации) набора факторов. Однако в подавляющем большинстве ситуаций получаемые с помощью пошаговой процедуры наборы переменных оказываются оптимальными или близкими к оптимальным.
Не нашли то, что искали? Воспользуйтесь поиском:
Программа дисциплины «эконометрика»
Вид материала | Программа дисциплины |
Содержание2) Ковариация – это… |
Подобный материал:
- Учебная программа название дисциплины Эконометрика для специальности (ей)/ специализации, 231.63kb.
- Примерная программа наименование дисциплины Эконометрика Рекомендуется для направления, 196.23kb.
- Программа дисциплины Эконометрика Для направления 080102. 65 Мировая экономика подготовки, 121.81kb.
- Рабочей программы учебной дисциплины эконометрика уровень основной образовательной, 43.19kb.
- Программа дисциплины ен. Р «Эконометрика» для студентов, 118.01kb.
- Программа дисциплины дс. 10.»Эконометрика» для студентов, 116.69kb.
- Рабочая программа наименование дисциплины Эконометрика, 234.87kb.
- Рабочая программа наименование дисциплины Эконометрика, 258.24kb.
- Программа дисциплины дн. Ф «Эконометрика» для студентов 4 курса направления 080100, 150.65kb.
- Программа и контрольные задания по учебной дисциплине «эконометрика» для студентов, 555.04kb.
1) Что такое стохастическая связь?
а) нелинейная зависимость между переменными
б) связь между одним случайным и одним детерминированным фактором
в) связь между переменными, осложненная влиянием случайных факторов
г) ни один из вариантов а)-в)
2) Ковариация – это…
а) показатель, позволяющий установить факт наличия линейной стохастической связи между переменными
б) явление линейной стохастической связи между переменными
в) показатель, характеризующий тесноту линейной стохастической связи между переменными
г) среди вариантов а)-в) нет верного
3) Корреляция – это…
а) показатель, позволяющий установить факт наличия линейной стохастической связи между переменными
б) явление линейной стохастической связи между переменными
в) показатель, характеризующий тесноту линейной стохастической связи между переменными
г) среди вариантов а)-в) нет верного
4) Коэффициент корреляции – это…
а) показатель, позволяющий установить факт наличия линейной стохастической связи между переменными
б) явление линейной стохастической связи между переменными
в) показатель, характеризующий тесноту линейной стохастической связи между переменными
г) среди вариантов а)-в) нет верного
5) Среди перечисленных ниже пар синонимами являются…
а) стохастическая связь и функциональная связь
б) стохастическая связь и корреляционная связь
в) корреляция и ковариация
г) корреляция и коэффициент корреляции
6) Функция регрессии является…
а) математическим выражением функциональной зависимости между переменными
б) математическим выражением корреляционной связи между переменными
в) математическим выражением исключительно линейной связи между переменными
г) среди вариантов а)-в) нет верного
7) По числу объясняющих факторов регрессии подразделяют на…
а) простые и сложные
б) простые и множественные
в) двойные, тройные и т.д.
г) среди вариантов а)-в) нет верного
8) По характеру связи между переменными регрессии в целом подразделяют на две группы:
а) положительные и отрицательные
б) равноускоренные и равнозамедленные
в) равномерно возрастающие и равномерно убывающие
г) среди вариантов а)-в) нет верного
9) Отрицательный характер взаимосвязи между переменными Х и У означает, что…
а) с ростом Х происходит рост У
б) с ростом Х происходит убывание У
в) рост Х не оказывает влияния на изменение У
г) среди вариантов а)-в) нет верного
10) По типу соединения явлений регрессии подразделяют на…
а) последовательные и параллельные
б) открытые и закрытые
в) прямые, косвенные и ложные
г) среди вариантов а)-в) нет верного
11) Какие требования предъявляются к случайному члену классической линейной модели множественной регрессии?
а) он должен быть распределен по экспоненциальному закону
б) он должен быть распределен по закону Пуассона
в) он должен быть распределен по биномиальному закону
г) среди вариантов а)-в) нет верного
а) означает постоянство дисперсии случайного члена регрессионного уравнения
б) означает отсутствие автокорреляции случайного члена регрессионного уравнения
в) предполагает отсутствие корреляционной связи между случайным членом и объясняющими переменными регрессионной модели
г) среди вариантов а)-в) нет верного
13) Одним из условий классической линейной регрессионной модели является…
а) нормальное распределение переменной У
б) отсутствие среди объясняющих факторов дискретных переменных
в) отсутствие автокорреляции случайного члена регрессионного уравнения
г) среди вариантов а)-в) нет верного
14) Каким свойством обладают оценки коэффициентов классической модели, полученные с помощью метода наименьших квадратов?
г) все ответы а)-в) верны
15) Как формулируется нулевая гипотеза при проверке коэффициента уравнения регрессии на статистическую значимость?
а) оценка коэффициента равна нулю
б) оценка коэффициента положительна
в) оценка коэффициента отрицательна
г) среди вариантов а)-в) нет верного
16) Какая формулировка нулевой гипотезы не используется при проверке уравнения регрессии на статистическую значимость?
а) коэффициент детерминации в полученном уравнении равен нулю
б) все коэффициенты при объясняющих переменных равны нулю
в) свободный член полученного уравнения равен нулю
г) среди вариантов а)-в) нет верного
17) Какой факт не свидетельствует о наличии мультиколлинеарности?
а) коэффициенты парной корреляции результирующего признака с каждым из объясняющих по модулю близки к единице
б) некоторые коэффициенты парной корреляции среди объясняющих факторов по модулю близки к единице
в) коэффициенты множественной детерминации некоторых объясняющих факторов с остальными близки к единице
г) среди вариантов а)-в) нет верного
18) О чем может свидетельствовать неверный, с точки зрения экономической теории, знак коэффициента линейного регрессионного уравнения?
а) о гетероскедастичности
б) об автокорреляции остатков
в) о мультиколлинеарности
г) среди вариантов а)-в) нет верного
19) В каком случае целесообразно использовать метод главных компонент?
а) если метод наименьших квадратов дает статистически незначимое уравнение
б) если объясняющие факторы коррелируют между собой
в) если свободный член полученного уравнения равен нулю
г) среди вариантов а)-в) нет верного
20) Что является недостатком метода главных компонент?
а) полученную модель нельзя использовать для прогнозирования
б) невозможна или затруднена экономическая интерпретация полученных результатов
в) снижается размерность исходной задачи
г) среди вариантов а)-в) нет верного
21) В каких задачах следует ожидать наличия гетероскедастичности?
а) когда анализируются определенные статьи расходов хозяйствующих субъектов в зависимости от величины их доходов и последние имеют значительный разброс
б) когда в выборке присутствуют наблюдения, сильно отличающиеся от большинства остальных
в) когда анализируются временные ряды и наблюденные значения существенно изменяются со временем или данные пространственных выборок определенным образом упорядочены
г) все варианты а)-в) верны
22) Какой способ не применяется для проверки эконометрической модели на гомоскедастичность?
а) тест Голдфелда-Квандта
б) тест Дарбина-Уотсона
в) тест Глейзера
г) среди вариантов а)-в) нет верного
23) Каковы негативные последствия применения классического МНК в случае гетероскедастичности?
а) оценки коэффициентов модели не являются состоятельными
б) оценки коэффициентов модели не являются статистически значимыми
в) оценки коэффициентов модели не являются эффективными
г) оценки коэффициентов модели являются смещенными
24) Какой метод оценивания следует использовать в условиях гетероскедастичности?
а) метод моментов
б) метод максимального правдоподобия
в) взвешенный метод наименьших квадратов
г) среди вариантов а)-в) нет верного
25) Взвешенный метод наименьших квадратов предполагает…
а) упорядочение исходных наблюдений по возрастанию/убыванию
б) упорядочение исходных наблюдений по времени
в) придание «веса» каждому наблюдению в определенном соответствии с величиной его дисперсии
г) среди вариантов а)-в) нет верного
26) В каких задачах следует ожидать автокорреляции остатков?
а) когда рассматривается изменение экономического климата в государстве
б) когда анализируются объемы продаж «сезонного» товара
в) когда исходными данными являются временные ряды
г) все варианты а)-в) верны
27) Что из перечисленного ниже не является особенностью теста Дарбина-Уотсона?
а) наличие областей неопределенности
б) область значений, ограниченная отрезком от 0 до 4
в) границы критических областей, симметричные относительно 2
г) среди вариантов а)-в) нет верного
28) Каким способом нельзя оценить тесноту автокорреляции остатков?
а) через приближенное соотношение коэффициента автокорреляции с расчетным значением статистики Дарбина-Уотсона
б) с помошью непосредственного расчета коэффициента корреляции
в) как коэффициент регрессии остатков на их предыдущие значения
г) среди вариантов а)-в) нет верного
29) Каким образом можно проверить гипотезу о переменной структуре модели?
а) с помощью теста Голдфелда-Квандта
б) с помощью теста Вальда
в) с помощью теста Чоу
г) среди вариантов а)-в) нет верного
30) Как поступают в случае, если качественная переменная, влияющая на структуру модели, ненаблюдаема?
а) объявляют задачу разбиения выборки на однородные группы в принципе неразрешимой
б) применяют специальные методы многомерного анализа, в частности, кластерный анализ
в) используют взвешенный метод наименьших квадратов
г) среди вариантов а)-в) нет верного
31) Для отражения влияния на структуру модели качественных переменных, если они наблюдаемы, применяют…
а) фальшивые переменные
б) фиктивные переменные
в) поддельные переменные
г) среди вариантов а)-в) нет верного
32) Какая из приведенных ниже моделей не поддается непосредственной линеаризации?
г) среди вариантов а)-в) нет верного
33) Что из перечисленного ниже не применяют для оценки нелинеаризуемых моделей?
а) итеративные процедуры
б) метод наименьших квадратов
в) метод максимального правдоподобия
г) среди вариантов а)-в) нет верного
34) При использовании метода максимального правдоподобия…
а) отыскиваются параметры модели, наиболее вероятные для данного набора наблюдений
б) отыскивается набор наблюдений, оптимизирующий параметры модели
в) параметры модели определяются методом Гаусса
г) среди вариантов а)-в) нет верного
35) Стационарность – это…
а) характеристика временного ряда, связанная с его стабильностью (устойчивостью)
б) правило отбора предикторов в регрессионную модель
в) синоним автокорреляции
г) среди вариантов а)-в) нет верного
36) Какие существуют виды стационарности?
а) строгая и слабая
б) высокая и низкая
в) постоянная и переменная
г) все варианты а)-в) верны
37) Что такое «белый шум»?
а) свойство коэффициентов регрессионной модели
б) модель временного ряда с независимыми одинаково распределенными наблюдениями
в) модель авторегрессии первого порядка
г) среди вариантов а)-в) нет верного
38) Какие модели временных рядов чаще всего используются на практике?
а) модель авторегрессии первого порядка
в) «случайное блуждание»
г) все варианты а)-в) верны
39) Какие экономические процессы целесообразно моделировать с помощью системы одновременных линейных уравнений?
а) формирование доходов в закрытой экономике без государственного участия (взаимосвязи между валовым выпуском, объемом потребления и инвестиций)
б) спрос и предложение в зависимости от цены товара и дохода
в) взаимосвязь между объемами потребления и инвестиций, заработной платой и доходами в частном секторе, равновесным совокупным спросом и объемом капитала
г) все варианты а)-в) верны
40) Почему для оценки параметров системы линейных одновременных уравнений нельзя применять одношаговый МНК?
а) из-за смещения получаемых оценок
б) из-за несостоятельности получаемых оценок
в) из-за некорректности проводимых статистических тестов
г) все варианты а)-в) верны
41) Какие методы не применяются для оценки параметров системы линейных одновременных уравнений?
а) косвенный метод наименьших квадратов
б) двухшаговый метод наименьших квадратов
в) трехшаговый метод наименьших квадратов
г) среди вариантов а)-в) нет верного
(Ответы на вопросы теста для текущего контроля знаний приведены в конце программы)
Примерный перечень вопросов к экзамену.
1) Что такое случайный член регрессионного уравнения? Приведите пример его экономической интерпретации.
2) Как экономически трактуются параметры классической линейной модели множественной регрессии?
3) Перечислите предпосылки классического уравнения регрессии.
4) Что такое “несмещенная оценка коэффициента уравнения регрессии”?
5) Что такое “эффективная оценка коэффициента уравнения регрессии”?
6) Что такое “состоятельная оценка коэффициента уравнения регрессии”?
7) По каким критериям производится отбор предикторов для регрессионной модели?
8) Какие способы отбора предикторов вы знаете?
9) В чем суть метода наименьших квадратов и каковы свойства МНК-оценок?
10) В чем состоит суть метода максимального правдоподобия и каковы свойства ММП-оценок?
11) Что такое “статистически значимый коэффициент уравнения регрессии”?
12) Как проверить статистическую значимость регрессионного уравнения?
13) Что такое коэффициент детерминации и каков его смысл?
14) Как проверить статистическую значимость коэффициента детерминации?
15) Как применять коэффициент детерминации для сравнительной оценки уравнений с одинаковой зависимой переменной и разным количеством предикторов?
16) Как выбрать лучшее из нескольких уравнений с одной и той же зависимой переменной?
17) Как оценить предельный вклад, вносимый в объясняющую способность регрессионного уравнения группой дополнительных объясняющих факторов?
18) Приведите примеры гипотез, часто формулируемых в отношении коэффициентов регрессионного уравнения, и объясните, с помощью каких тестов их можно проверить.
19) Каковы признаки «хорошей» (правильно специфицированной) модели?
20) Как влияет на качество оценки коэффициентов уравнения ошибка спецификации, вследствие которой в модель не был включен существенный предиктор?
21) Чем опасно включение в модель «лишних» (несущественных) объясняющих переменных?
22) Что такое гомоскедастичность и гетероскедастичность?
23) Приведите пример взаимоотношений в экономике, описываемых моделью с гетероскедастичными остатками.
24) Как осуществляется проверка эконометрической модели на гомоскедастичность?
25) Почему нельзя применять классический МНК в случае гетероскедастичности?
26) Какие преобразования исходных данных нужно провести в случае обнаружения гетероскедастичности?
27) Как вы понимаете термин «автокорреляция остатков»?
28) Приведите пример взаимоотношений в экономике, описываемых моделью с автокоррелированными остатками.
29) Каковы последствия применения классического МНК к модели с автокоррелированными остатками?
30) Каким образом осуществляется проверка эконометрической модели на автокорреляцию остатков?
31) Какие преобразования исходных данных нужно провести в случае обнаружения автокорреляции остатков?
32) Что такое мультиколлинеарность?
33) Как можно предсказать наличие мультиколлинеарности в будущей модели?
34) По каким проявлениям можно судить о наличии мультиколлинеарности в оцененной модели?
35) Каковы негативные последствия мультиколлинеарности?
36) В каком случае целесообразно использовать метод главных компонент?
37) Что представляют собой главные компоненты?
38) Что показывает первая главная компонента?
39) Что представляют собой коэффициенты при факторах в выражениях главных компонент?
40) Каковы недостатки метода главных компонент?
41) Какие модели с лаговыми независимыми переменными Вы знаете?
42) Какие методы применяются для оценки коэффициентов эконометрических моделей, содержащих лаговые зависимые переменные?
43) Какие характеристики временных рядов вы знаете?
44) Что такое стационарный процесс?
45) Как проверить процесс на стационарность?
46) Перечислите известные вам модели временных рядов и приведите примеры процессов в экономике, описываемых с помощью моделей временных рядов.
47) Модель авторегрессии первого порядка.
48) Модель скользящего среднего.
49) Модель авторегрессии–скользящего среднего.
50) Уравнение Юла-Уокера.
51) Что является объектом изучения финансовой эконометрики?
52) Каковы особенности временных рядов финансовых показателей?
53) Что означают гипотезы случайного блуждания и каковы методы их тестирования?
54) Каковы методы оценки параметров Броуновского движения, применяемые в финансовой эконометрике?
55) Каковы методы тестирования изменяющейся вариации в моделях финансовых процессов?
56) Какие методы применяются для тестирования нелинейных финансовых поцессов?
57) Как оценивают модели финансовых процессов с изменяющейся вариацией?
58) Какие модели временных рядов финансовых показателей с нелинейными структурами Вам известны?
59) Что собой представляет система взаимозависимых эконометрических уравнений?
60) Приведите пример экономической системы, описываемой системой одновременных линейных уравнений.
61) Почему для оценки параметров системы линейных одновременных уравнений нельзя применять одношаговый МНК?
62) Что показывают коэффициенты структурной и прогнозной формы системы линейных одновременных уравнений?
63) Какие ограничения накладывают на структурные переменные в системе взаимозависимых эконометрических уравнений?
64) Какие бывают ограничения на дисперсии и ковариации в рамках системы взаимозависимых эконометрических уравнений?
65) Что представляет собой рекурсивная модель?
66) Каким образом можно проверить гипотезу о переменной структуре модели?
67) Как отражают влияние качественных переменных на структуру эконометрической модели?
68) Приведите пример качественной переменной, способной повлиять на структуру какой-либо эконометрической модели. Какие фиктивные переменные могут отразить это влияние?
69) Какие проблемы возникают при построении моделей с дискретными зависимыми переменными?
70) Приведите примеры взаимосвязей в экономике, для описания которых используют модели с качественными зависимыми признаками, и объясните, с помощью каких переменных удается формализовать эти взаимосвязи.
71) Какие модели чаще всего используют в случае, когда зависимая переменная является дихотомической?
72) В чем особенности применения и построения Tobit-модели?
73) Приведите примеры нелинейных моделей, используемых в эконометрике.
74) Какие из известных вам типов нелинейных моделей поддаются непосредственной линеаризации и в чем причина их нелинеаризуемости?
75) Как линеаризуются модели гиперболического вида?
76) Как линеаризуются модели экспоненциального вида?
77) Как линеаризуются модели степенного вида?
78) Как линеаризуются модели логарифмического вида?
79) Какие методы используются для оценки параметров моделей, не поддающихся непосредственной линеаризации?
80) В чем заключается процедура прогнозирования с использованием эконометрических моделей?
81) Какие методы верификации прогноза Вы знаете?
82) Как оценить точность прогноза?
83) Как оценивают доверительный интервал прогноза в моделях с детерминированнными параметрами?
84) Как оценивают доверительный интервал прогноза в моделях со стохастическими параметрами?
V Тесты для проверки остаточных знаний
(требуется выбрать правильный ответ среди 5 предложенных вариантов)
1. Показатель, характеризующий тесноту линейной стохастической связи между переменными — это…
б) коэффициент корреляции
г) все варианты а)-в) верны
д) среди вариантов а)-г) нет верного
2. Функция регрессии в общем случае является…
а) математическим выражением функциональной зависимости между переменными
б) математическим выражением корреляционной связи между переменными
в) математическим выражением исключительно линейной связи между переменными
г) математическим выражением любого рода зависимости между переменными
д) среди вариантов а)-г) нет верного
3. Уравнение регрессии вида Y(t)=α+βX(t)+ε(t) не означает, что…
а) переменные Y и X связаны между собой линейно
б) связь между Y и X является стохастической
в) на переменную Y не оказывают влияния никакие факторы, кроме X
г) с ростом переменной X на одну единицу Y увеличивается на β единиц
д) среди вариантов а)-г) нет верного
а) означает постоянство дисперсии случайного члена регрессионного уравнения
б) предполагает отсутствие корреляционной связи между случайным членом и объясняющими переменными регрессионной модели
в) является одним из условий классической модели линейной регрессии
г) верны варианты а) и в)
д) верны варианты б) и в)
5. Одним из условий классической линейной регрессионной модели является…
а) отсутствие какого-либо влияния на Y со стороны факторов, не включенных в модель явно
б) отсутствие среди объясняющих факторов дискретных переменных
в) отсутствие автокорреляции случайного члена
г) верны варианты а) и б)
д) среди вариантов а)-г) нет верного
6. Каким свойством обладают оценки коэффициентов классической модели, полученные с помощью метода наименьших квадратов?
г) все ответы а)-в) верны
д) среди вариантов а)-г) нет верного
7. Как формулируется нулевая гипотеза при проверке коэффициента уравнения регрессии на статистическую значимость?
а) оценка коэффициента равна нулю
б) оценка коэффициента положительна
в) оценка коэффициента отрицательна
г) дисперсия оценки коэффициента минимальна
д) среди вариантов а)-г) нет верного
8. Какая формулировка нулевой гипотезы не используется при проверке уравнения регрессии на статистическую значимость?
а) коэффициент детерминации в полученном уравнении равен нулю
б) все коэффициенты при объясняющих переменных равны нулю
в) свободный член полученного уравнения равен нулю
г) все варианты а)-в) верны
г) среди вариантов а)-г) нет верного
9. Какой факт не может свидетельствовать о наличии мультиколлинеарности?
а) коэффициенты парной корреляции результирующего признака с каждым из объясняющих факторов по модулю близки к единице
б) некоторые коэффициенты парной корреляции среди объясняющих факторов по модулю близки к единице
в) коэффициенты множественной детерминации некоторых объясняющих факторов с остальными близки к единице
г) неверный, с точки зрения экономической теории, знак коэффициента линейного регрессионного уравнения
д) среди вариантов а)-г) нет верного
10. В каком случае целесообразно использовать метод главных компонент?
а) если метод наименьших квадратов дает статистически незначимое уравнение
б) если объясняющие факторы коррелируют между собой
в) если свободный член полученного уравнения равен нулю
г) есди колическтво наблюдений недостаточно велико по сравнению с числом объясняющих факторов
д) среди вариантов а)-г) нет верного
11. Взвешенный метод наименьших квадратов…
а) применяется в случае гетероскедастичных остатков
б) предполагает упорядочение исходных наблюдений по возрастанию/убыванию
в) предполагает придание «веса» каждому наблюдению в определенном соответствии с величиной его дисперсии
г) верны варианты а) и в)
д) среди вариантов а)-г) нет верного
12. Каковы негативные последствия применения классического метода наименьших квадратов в случае гетероскедастичности?
а) оценки коэффициентов модели не являются состоятельными
б) оценки коэффициентов модели не являются статистически значимыми
в) оценки коэффициентов модели не являются эффективными
г) оценки коэффициентов модели являются смещенными
д) все варианты а)-г) верны
13. В каких задачах следует ожидать наличия гетероскедастичности?
а) когда анализируются определенные статьи расходов хозяйствующих субъектов в зависимости от величины их доходов и последние имеют значительный разброс
б) когда в выборке присутствуют наблюдения, сильно отличающиеся от большинства остальных
в) когда анализируются временные ряды и наблюденные значения существенно изменяются со временем или данные пространственных выборок определенным образом упорядочены
г) все варианты а)–в) верны
д) среди вариантов а)-г) нет верного
14. Об автокорреляции остатков можно сказать, что…
а) факт ее существования устанавливается с помощью критерия Дарбина-Уотсона
б) она часто встречается в задачах, где исходными данными являются временные ряды
в) ее следствием, в частности, является неэффективность оценок параметров регрессионного уравнения
г) в случае ее существования следует применять обобщенный метод наименьших квадратов
д) все варианты а)-г) верны
15. Для отражения влияния на структуру модели качественных переменных, если они наблюдаемы, применяют…
а) фальшивые переменные
б) фиктивные переменные
в) поддельные переменные
г) искусственные переменные
д) среди вариантов а)-г) нет верного
16. Какая из приведенных ниже моделей не поддается непосредственной линеаризации?
д) среди вариантов а)-в) нет верного
17. Что из перечисленного ниже не применяют для оценки параметров нелинеаризуемых моделей?
а) итеративные процедуры
б) метод наименьших квадратов
в) метод максимального правдоподобия
г) верны варианты б) и в)
д) среди вариантов а)-г) нет верного
18. При использовании метода максимального правдоподобия…
а) отыскиваются параметры модели, наиболее вероятные для данного набора наблюдений
б) отыскивается набор наблюдений, оптимизирующий параметры модели
в) оценивается вероятность, с которой набор параметров модели принимает оптимальные значения
г) верны варианты а) и в)
д) среди вариантов а)-г) нет верного
19. Стационарность – это…
а) свойство оценок параметров регрессионного уравнения
б) правило отбора предикторов в регрессионную модель
в) характеристика временного ряда, связанная с его стабильностью (устойчивостью)
г) синоним автокорреляции
д) среди вариантов а)-г) нет верного
20. Какие существуют виды стационарности?
а) строгая и слабая
б) высокая и низкая
в) постоянная и переменная
г) внешняя и внутренняя
д) все варианты а)-г) верны
21. Что такое «белый шум»?
а) отклонение наблюдаемых значений переменной от расчетных
б) модель временного ряда с независимыми одинаково распределенными наблюдениями
в) модель авторегрессии первого порядка
г) характеристика оценок параметров регрессионного уравнения
д) среди вариантов а)-в) нет верного
22. Какие модели временных рядов чаще всего используются на практике?
а) модель авторегрессии первого порядка
в) «случайное блуждание»
г) все варианты а)-в) верны
д) среди вариантов а)-в) нет верного
23. Среди переменных в системах одновременных линейных уравнений специально выделяют…
а) результирующие и объясняющие
б) случайные и детерминированные
в) эндогенные и экзогенные
г) фиктивные и обычные
г) все варианты а)-в) верны
24. Почему для оценки параметров системы линейных одновременных уравнений нельзя применять одношаговый МНК?
а) из-за смещения получаемых оценок
б) из-за несостоятельности получаемых оценок
в) из-за некорректности проводимых статистических тестов
г) все варианты а)-в) верны
д) среди вариантов а)-г) нет верного
25. Какие методы не применяются для оценки параметров системы линейных одновременных уравнений?
а) косвенный метод наименьших квадратов
б) двухшаговый метод наименьших квадратов
в) трехшаговый метод наименьших квадратов
г) не применяется ни один из методов а)-в)
д) среди вариантов а)-г) нет верного
YI Учебно-методическое обеспечение курса
1. Рекомендуемая литература (основная)
1. Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики: Учебник для вузов. М.: ЮНИТИ, 1998.
2. Доугерти К. Введение в эконометрику: Учебник для вузов. М.:Инфра — М, 1999.
3. Магнус Я. Р. Эконометрика: Начальный курс: Учебное пособие для вузов. М.: Дело, 1998.
4. Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов. М.:ЮНИТИ-ДАНА, 2002.
5. Бородич С.А. Эконометрика: Учебное пособие. Мн.: Новое знание, 2001.
6. Эконометрика: Учебник/Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2002.
7. Сборник задач по дисциплине «Эконометрика» /Сост. Н.П.Тихомиров, Е.Ю.Дорохина, Л.Ф.Преснякова. – М.: Изд-во Рос.экон.акад. (в печати).
2. Рекомендуемая литература (дополнительная)
1. Грубер Й. Эконометрия 1: Введение во множественную регрессию и эконометрию. Б.м.: Б.и., 1993. Ч.1, 2, 3.
2. Джонстон Дж. Эконометрические методы. М.: Статистика, 1980.
3. Дрейпер Н., Смит Г. Прикладной регрессионный анализ: В 2 кн. М.: Финансы и статистика,1987-1988.
4. Тихомиров Н. П., Попов В. А. Методы социально-экономического прогнозирования. М.: Изд-во ВЗПИ, 1993.
3. Полезные web-сайты
4. Перечень обучающих, контролирующих компьютерных программ.
Электронная таблица Excel, пакеты Econometric Views, Statgraphics, программы Regre,Trend.
Эконометрика _лабор. раб
ошибка оценки параметра β ˆ i . Величина S βˆ i показывает, на-
сколько в среднем значение β ˆ i отклоняется от истинного значе-
ния β i . Значение S βˆ i вычисляется по формулам, приведенным в
лабораторной работе № 3.
Незначимость параметра β i означает, что β i = 0 для вы-
бранного уровня доверия (уровня значимости) и что переменная y не зависит фактически от переменной x i . Это может быть осно-
ванием для исключения переменной x i из модели множествен-
ной линейной регрессии. Однако незначимость β i может также означать, что связь между переменными у и x i носит более слож-
ный, нелинейный характер и имеет смысл исследовать нелинейные модели.
При определении значимости параметров уравнения и уравнения в целом необходимо выполнить следующие действия.
1. Рассчитать S βˆ i стандартные ошибки оценок.
3. Определить по таблицам распределения Стьюдента t кр для вы-
бранного уровня значимости и числа степеней свободы ( n – k – 1), где n — число наблюдений, k — число независимых переменных модели.
4. Сравнить t β i с t кр : если t β i > t кр , то коэффициент β i значим
на выбранном уровне значимости, в противном случае — незначим.
Для определения возможных значений коэффициентов уравнения необходимо построить доверительные интервалы коэффициентов
Оценка значимости уравнения в целом состоит в проверке
гипотезы H 0 : β 1 = β 2 = . = β k (при альтернативной гипотезе
H 1 , состоящей в том, гипотеза H 0 неверна), т. е. проверке того
факта, что все коэффициенты при независимых переменных в уравнении регрессии равны нулю и переменные модели не оказывают никакого влияния на зависимую переменную. В этом случае уравнение не имеет смысла, т. е. незначимо.
Для проверки этой гипотезы рассчитывается
где число наблюдений, k — число независимых переменных (не считая свободного члена).имеет распределение Фишера со степенями свободы ( k , n — k
Чтобы проверить значимость уравнения в целом, надо:
1) задать уровень значимости α ;
2) для выбранного уровня значимости и числа степеней свободы по таблицам, в которых приведены квантили распределения Фишера, найти критическое значение F — статистики;
3) сравнить рассчитанное значение F с критическим значением F кр : если F > F кр , то уравнение в целом значимо
для выбранного уровня доверия; в противном случае, если F £ F кр , делается вывод, что уравнение в целом незна-
в разных моделях с разным числом наблюдений
и (или) переменных несравнимы.
3. Оценка качества подгонки регрессионного уравнения к
Для оценки качества подгонки уравнения к выборочным данным, т. е. проверки близости к фактическим рассчитанных по модели значений, используется коэффициент детерминации
R 2 . Он определяется аналогично тому, как это было для парной линейной регрессии:
— среднее значение зависимой переменной,
рассчитанное по модели (прогноз-
ное) значение зависимой переменной.
Справедливо соотношение 0 £ R 2 £ 1 . Чем ближе R 2 к единице, тем в выше качество подгонки, тем ближе расчетные значе-
ния к фактическим. Близость R 2 к нулю означает, что в качестве прогноза лучше использовать среднее значение зависимой пере-
менной, а не расчетные значения y ˆ t .
Значение коэффициента детерминации R 2 повышается, если число независимых переменных возрастает, независимо от «ценности» вклада дополнительной переменной.
Чтобы исключить при оценке качества подгонки влияние на величину коэффициента детерминации увеличения числа переменных в модели, рассчитывают скорректированный коэффи-
циент детерминации R 2
где n — число наблюдений, k — число независимых переменных (не считая свободного члена).
Отметим некоторые свойства скорректированного коэффи-
циента детерминации R adj 2 :
2) R adj 2 £ 1 , но может быть меньше нуля !
Если при добавлении переменной в модель линейной регрессии увеличивается не только значение коэффициента детер-
минации R 2 , но и значение скорректированного коэффициента
детерминации R adj 2 , то можно утверждать, что вклад этой пере-
менной в объяснение изменений зависимой переменной (повышение качества подгонки к данным) существенно. Это используется при выполнении пошагового регрессионного анализа, основанного на последовательном включении (или исключении) переменных в модель.
Качество подгонки уравнения к данным также характери-
зуют следующие показатели: средняя абсолютная процентная ошибка (см. для парной регрессии, лаб. работа № 3) и стандарт-
ная ошибка регрессии
Значения S e в однотипных моделях с разным числом на-
блюдений и (или) переменных сравнимы.
4. Проверка переменных модели на мультиколлинеарность, ее исключение
Мультиколлинеарность — наличие линейной статистической зависимости между факторными признаками, что вызывает неустойчивость оценок коэффициентов регрессии.
При наличии эффекта мультиколлинеарности матрица X T X , использующаяся при вычислении оценок параметров уравнения,
будет близка к вырожденной.
1. Стандартные ошибки коэффициентов завышены (больше реальных), следовательно, вычисленные занижены.
2. Неустойчивость оценок. Добавление или исключение малого количества наблюдений может привести к очень сильному изменению оценок коэффициентов, при этом резко уменьшается и точность предсказания по модели.
3. Высокая коррелированность коэффициентов лишает смысла их интерпретацию.
1) некоторые из оценок параметров регрессии имеют неверный с
точки зрения экономической теории (здравого смысла) знак;
2) небольшое изменение исходных данных (исключение или добавление небольшой порции наблюдений) приводит к существенному изменению оценок параметров уравнения регрессии;
3) большинство коэффициентов уравнения регрессии незначимо, хотя уравнение в целом значимо и имеет достаточно высокий коэффициент детерминации;
4) высокие парные коэффициенты корреляции;
5) высокие частные коэффициенты корреляции.
Одним из способов устранения эффекта мультиколлинеарно-
сти является метод переменных. При этом выполняются следующие действия:
1. Строится регрессионная модель методом наименьших квадратов.
2. Оценивается значимость параметров регрессии.
3. Выявляется наличие зависимости между факторными признаками путем анализа матрицы парных коэффициентов корреляции и матрицы частных коэффициентов корреляции.
4. Строится новое уравнение регрессии с исключением незначимых и части взаимно коррелирующих переменных. При этом из числа коррелирующих переменных в модели оставляют те, которые более соответствуют ее экономическому содержанию, либо те, которые имеют наибольшее значение частной корреляции с зависимой переменной. При необходимости включаются уже исключенные переменные, если этого требует экономический смысл.
5. Повторяются ишаги до тех пор, пока мультиколлинеарность не будет исключена.
5. Проверка модели на гетероскедастичность, коррекция на
гетероскедастичность в случае необходимости
На практике часто встречаются модели, в которых не выполняется условие теоремы Гаусса — Маркова о том, что все случайные компоненты уравнения регрессии имеют одинаковую дисперсию (одинаковый разброс относительно среднего, нулевого значения). Это условие называется гомоскедастичностью . Нарушение условия постоянства дисперсий называется гетеро-
Гетероскедастичность не приводит к смещению оценок уравнений, т. е. оценки остаются несмещенными, но они не будут эффективными. Гетероскедастичность приводит к заниженным значениям стандартных ошибок, получаемых обычным МНК, вследствие чего завышаются и дается неправильное (завышенное) представление о точности оценок. Заметим, что гетероскедастичность остатков может быть вызвана неправильным выбором модели (например, рассмотрением линейной модели в случае, когда истинная связь между переменными носит нелинейный характер). При наличии гетероскедастичности необходимо использовать обобщенный метод наименьших квадратов.
Для проверки модели на гетероскедастичность чаще всего используется тест Уайта , который основан на следующем предположении: если в модели присутствует гетероскедастичность, то это может быть связано с тем, что дисперсии ошибок зависят от регрессоров, а гетероскедастичность должна отражаться в остатках обычной регрессии исходной модели.
В данном методе тестирования гипотезы H 0 не делается предположений относительно структуры гетероскедастичности.
Для проведения теста необходимо:
− провести обычную регрессию и получить вектор регрессионных остатков e = ( e 1 , e 2 . e n ) , где e t = y ˆ t − y t , представляющее отклонение расчетных (прогнозных) значений зависимой переменной от фактических значений;
− провести регрессию e t 2 на все независимые переменные, их квадраты, попарные произведения и свободный член;
− построить статистику nR 2 .
Если верна гипотеза Н 0 : отсутствие гетероскедастичности, то величина имеет распределение χ 2 (N – 1) , где N — количество регрессоров.
Для учета гетероскедастичности используют стандартные ошибки, рассчитанные с «поправкой» на гетероскедастичность:
1) стандартные ошибки в форме Уайта;
2) стандартные ошибки в форме Невье — Веста.
Стандартные ошибки в форме Уайта называются также со-
стоятельными стандартными ошибками при наличии гетеро-
- http://geum.ru/next/art-47759.leaf-3.php
- http://studfiles.net/preview/2439413/page:5/