Трохи про регресії. Не тільки в парному трейдингу.

Anonim

У минулій статті про коінтеграційних підході, я коротко упомінул про те, що таке регресія, і навіщо вона потрібна в парному трейдингу. Для того щоб трохи більш наочно показати суть регресії, візьмемо приклад з попередньої статті. Отже у нас є дані про кількість відвідувачів магазину кожен день, і щоденна виручка в форматі:

Нам необхідно визначити як в середньому змінюється виручка магазину в залежності від кількості відвідувачів. Нанесемо кожен день даних, як точки на графік, де за Х візьмемо кількість відвідувачів, а за Y кількість покупців.

Проведемо лінію яка імовірно описує наші дані.

Щоб зрозуміти наскільки точно проведена лінія описує залежність наших даних. У нас є два варіанти: Підрахувати суму модулів відхилень точок до лінії. Або підрахувати суму квадратів цих відхилень.

Ми виберемо другий варіант, оскільки підрахунок модулів дає неоднозначні результати (сума модулів може бути одна і та ж, а криві різні).

Підрахуємо суму квадратів відхилень від наших спостережень до проведеної лінії.

Потім проведемо ще одну лінію, і якщо сума відхилень від цієї лінії буде менше. То ми виберемо її. Так поки не знайдемо лінію, де сума квадратів відхилень буде найменшою. Кут нахилу буде коефіцієнтом гамма β (іноді називають гамою γ) в регресійному рівнянні:

Приблизно так виглядає суть (підкреслюю) методу побудови регресії.

Найбільш поширеним і простим методом побудови регресії є Метод Наіменьщіх Квадратів (МНК. Від англ OLS). Однак часто використання МНК може привести до помилок пов'язаних з тим, що метод розрахунку МНК є несиметричним. Що це означає?

Це означає що регресія де кількість відвідувачів буде незалежною змінною, найчастіше буде відрізнятися від регресії побудованої за тими ж даними, але з кількістю виручки в якості незалежної змінної.

Інакше кажучи:

Це відбувається тому що в МНК враховується тільки варіативність однієї змінної і єдине джерело дисперсії, а другу вважає константою з нульовою дисперсією.

Наприклад:

За логікою речей спреди повинні бути дзеркальними, але цього не відбувається. Стрілочками виділив де чітко видно невідповідність. Це означає що лонг по Х, шорт по Y, не теж саме що шорт по Х і лонг по Y.

Виправити ситуацію може використання ортогональної регресії (TLS, EIW, Deming regression), неї бета виходить дзеркальної. Хоча самі алгоритми розрахунку трохи складніше.

Ось така коротка стаття, думки в слух. Готую до роботи (згадую) методику стохастика.

А сьогодні о 19: 00, всім хто цікавиться парним трейдингом, необхідно бути тут:

//utmagazine.ru/posts/6795-vebinar-po-parnomu-treydingu-18-marta-v-sredu (!!!)