در نظریه احتمال و آمار ، یک ماتریس کوواریانس (همچنین به عنوان ماتریس کوواریانس خودکار، ماتریسپراکندگی ، ماتریس واریانس ، یا ماتریس واریانس کوواریانس نیز شناخته میشود) یک ماتریس مربعی است که کوواریانس بین هر جفت از عناصر یک بردار تصادفی معینی را نشان میدهد. هر ماتریس کوواریانس متقارن و نیمه معین مثبت است و قطر اصلی آن دارای مقادیر واریانس است.
ماتریس کوواریانس مفهوم واریانس را به ابعاد چندگانه تعمیم می دهد. برای مثال، تغییر در مجموعه ای از نقاط تصادفی در فضای دو بعدی را نمی توان به طور کامل با یک عدد مشخص کرد، همچنین لازم به ذکر است واریانس های موجود در و دستورالعمل ها حاوی تمام اطلاعات لازم هستند. ماتریس برای توصیف کامل تغییرات دو بعدی ضروری است.
ماتریس کوواریانس یک بردار تصادفی است که با علامت یا نشان داده می شود.
نامگذاری ها متفاوت است. برخی از آماردانان، به پیروی از ویلیام فلر احتمال گرا در کتاب دو جلدی خود، مقدمه ای بر نظریه احتمال و کاربردهای آن ، ماتریس را واریانس بردار تصادفی می نامند، زیرا تعمیم طبیعی به ابعاد بالاتر واریانس 1 بعدی است. دیگران آن را ماتریس کوواریانس می نامند، زیرا ماتریس کوواریانس بین اجزای اسکالر بردار است.
هر دو فرم کاملا استاندارد هستند و هیچ ابهامی بین آنها وجود ندارد. ماتریس اغلب ماتریس واریانس کوواریانس نیز نامیده می شود، زیرا عبارات مورب (روی قطر اصلی) در واقع واریانس هستند.
همچنین در پایین نماد ماتریس کوواریانس متقاطع بین دو بردار را مشاهده می کنید.
ماتریسی نزدیک به ماتریس کوواریانس از لحاظ مفهومی، ماتریس ضرایب همبستگی محصول- لحظه پیرسون بین هر یک از متغیرهای تصادفی در بردار تصادفی است، که می تواند به صورت زیر نوشته شود:
جایی که ماتریس قطری است که عناصر روی قطر آن مقادیر هستند (یعنی یک ماتریس مورب از واریانس های برای ).
هر عنصر روی قطر اصلی یک ماتریس covariance، همبستگی یا همان correlation یک متغیر تصادفی با خودش است که همیشه برابر با 1 است. همچنین هر عنصر خارج از مورب موجود بین 1- تا 1+ است.
ماتریس به عنوان ماتریس ضرایب رگرسیون شناخته می شود، در حالی که در جبر خطی Schur complement در است.
ماتریس ضرایب رگرسیون اغلب ممکن است به شکل انتقال داده شود. مناسب برای ضرب یک بردار ردیفی از متغیرهای توضیحی است به جای اینکه یک بردار ستونی را از قبل ضرب کنیم. در این شکل آنها با ضرایب به دست آمده با معکوس کردن ماتریس معادلات نرمال حداقل مربعات معمولی (OLS) مطابقت دقیق دارند.
یک ماتریس کوواریانس با همه عناصر غیر صفر می گوید که همه متغیرهای تصادفی فردی به هم مرتبط هستند. این بدان معنی ست که متغیرها نه تنها مستقیماً همبستگی دارند، بلکه از طریق سایر متغیرها نیز حتی به طور غیرمستقیم همبستگی دارند. اغلب چنین همبستگیهای غیرمستقیم و معمولی بیاهمیت و غیر کاربردی هستند. آنها را می توان با محاسبه ماتریس کوواریانس جزئی، که بخشی از ماتریس کوواریانس است که تنها بخش جالب همبستگی ها را نشان می دهد، سرکوب و خلا سلاح کرد.
اگر دو بردار از متغیرهای تصادفی و از طریق بردار دیگری مثل همبستگی دارند، همبستگی های اخیر در یک ماتریس سرکوب یا به اصطلاح suppressed می شوند [۱]
ماتریس کوواریانس جزئی به طور مؤثر ماتریس کوواریانس ساده است که مثل اینکه متغیرهای تصادفی غیر جالب هستند که ثابت نگه داشته شدند.
اگر بردار ستونی از متغیرهای تصادفی احتمالاً همبسته به طور مشترک به طور نرمال یا به طور کلی بیضوی توزیع شوند ، سپس تابع چگالی احتمال آن را می توان بر حسب ماتریس کوواریانس به شرح زیر بیان کرد
با اعمال بر یک بردار، ماتریس کوواریانس یک ترکیب خطی c از متغیرهای تصادفی X را روی بردار کوواریانس با آن متغیرها ترسیم می کند: . با در نظر گرفتن یک فرم دو خطی ، کوواریانس بین دو ترکیب خطی به دست میآید: . در نتیجه واریانس یک ترکیب خطی است، که کوواریانس آن با خودش است.
به طور مشابه، ماتریس کوواریانس معکوس (شبه) یک محصول درونی ارائه می دهد ، که فاصله Mahalanobis را القا می کند، معیاری برای "عدم احتمال" c .
طبق مفاهیم بالا فرض کنید یک بردار است پس ارزش واقعی بردار زیر
همیشه باید غیرمنفی باشد، زیرا واریانس یک متغیر تصادفی با ارزش واقعی است، بنابراین یک ماتریس کوواریانس همیشه یک ماتریس مثبت-نیمه معین است.
استدلال فوق را می توان به صورت زیر گسترش داد:که در آن آخرین نابرابری از مشاهده که اسکالر است.
برعکس، هر ماتریس نیمه معین مثبت متقارن یک ماتریس کوواریانس است. برای دیدن این، فرض کنید یک ماتریس متقارن مثبت-نیمه معین است. حال از حالت بعد محدود قضیه طیفی (spectral theorem)، نتیجه می شود که دارای یک جذر متقارن غیر منفی است که می توان آن را با M1/2 نشان داد . اجازه دهید هر گونه وکتور با ارزش بردار ستونی که ماتریس کوواریانس آن ماتریس هویت است باشد.
که در آن مزدوج مختلط یک عدد مختلط است نشان داده شده است ; بنابراین واریانس یک متغیر تصادفی مختلط یک عدد واقعی است.
اگر یک بردار ستونی متشکل از متغیرهای تصادفی با اعداد مختلط باشد، سپس ترانهاده مزدوج (conjugate transpose) از هر دو جابجایی و مزدوج شدن تشکیل می شود. در عبارت زیر، حاصل ضرب یک بردار با جابهجایی مزدوج آن، یک ماتریس مربعی به نام ماتریس کوواریانس به عنوان انتظار آن ایجاد میکند:
برای بردارهای تصادفی پیچیده، نوع دیگری از گشتاور مرکزی دوم، ماتریس شبه کوواریانس pseudo-covariance matrix(همچنین ماتریس رابطه نامیده می شود) به صورت زیر تعریف می شود:
برخلاف ماتریس کوواریانس تعریف شده در بالا، جابجایی hermitian با جابجایی در تعریف جایگزین میشود. عناصر مورب آن ممکن است دارای ارزش پیچیده باشند. این یک ماتریس متقارن پیچیده است.
اگر و ماتریس های داده مرکزی به ابعاد و باشند، یعنی با n ستون مشاهدات ردیف های p و q از متغیرها که میانگین ردیف از آنها کم شده است، اگر میانگین ردیف ها از داده ها برآورد شد، ماتریس های کوواریانس نمونه و را می توان تعریف کرد:
یا اگر میانگین ردیف از قبل شناخته شده بود،
این ماتریسهای کوواریانس نمونه تجربی سادهترین و اغلب مورد استفادهترین تخمینگر ها برای ماتریسهای کوواریانس هستند، اما تخمینگر های دیگری نیز وجود دارند، از جمله تخمینگر های منظم یا انقباضی که ممکن است ویژگیهای بهتری داشته باشند.
ماتریس کوواریانس ابزار مفیدی در زمینه های مختلف است. از آن می توان یک ماتریس تبدیل(transformation matrix) به دست آورد که به آن تبدیل سفیدکننده (whitening transformation) نیز گویند که به فرد اجازه می دهد تا داده ها را به طور کامل مرتبط کند. یا از دیدگاهی متفاوت، برای یافتن مبنایی بهینه برای نمایش داده ها به روشی فشرده (برای اثبات رسمی و خواص اضافی ماتریس های کوواریانس به ضریب ریلی مراجعه کنید). که PCA و (KL-transform) نامیده می شود.
در نگاشت کوواریانس مقادیر یا ماتریس به صورت یک نقشه دو بعدی رسم می شود. زمانی که بردارها و توابع تصادفی گسسته هستند، نقشه روابط آماری بین مناطق مختلف توابع تصادفی را نشان می دهد. مناطق مستقل آماری توابع بر روی نقشه به صورت زمین مسطح سطح صفر نشان داده می شوند، در حالی که همبستگی های مثبت یا منفی به ترتیب به صورت تپه ها یا دره ها نشان داده می شوند.
در عمل بردارهای ستون ، و به صورت تجربی به عنوان ردیف هایی از نمونه های nتایی به دست می آیند، به عنوان مثال
جایی که i امین مقدار گسسته در نمونه j تابع تصادفی است. مقادیر مورد نیاز در فرمول کوواریانس با استفاده از میانگین نمونه تخمین زده می شود، به عنوان مثال
و ماتریس کوواریانس توسط ماتریس کوواریانس نمونه تخمین زده می شود:
در جایی که براکتهای زاویهای نشاندهنده میانگینگیری نمونه هستند، به جز اینکه اصلاح بسل باید برای جلوگیری از سوگیری (BIAS) انجام شود . با استفاده از این تخمین ماتریس کوواریانس جزئی را می توان به صورت محاسبه کرد:
که در آن علامت backslash عملگر تقسیم ماتریس سمت چپ (LMD)را نشان می دهد که شرط معکوس کردن یک ماتریس را دور می زند و در برخی بسته های محاسباتی مانند Matlab موجود است . [۲]
شکل 1 نشان می دهد که چگونه یک نقشه کوواریانس جزئی بر روی نمونه ای از آزمایش انجام شده در لیزر الکترون آزادFLASH در هامبورگ ساخته شده است. تابع تصادفی طیف زمان پرواز یونهای حاصل از انفجار کولنی از مولکولهای نیتروژن است که توسط یک پالس لیزر یونیزه شدهاند. از آنجایی که تنها چند صد مولکول در هر پالس لیزر یونیزه می شوند، طیف های تک شات به شدت در نوسان هستند. با این حال، جمع آوری به طور معمول چنین طیف هایی، ، و میانگین آنها را بیش از حد یک طیف صاف تولید می کند توجه کنید به که با رنگ قرمز در پایین شکل 1 نشان داده شده است. طیف متوسط چندین یون نیتروژن را به شکل پیک هایی که توسط انرژی جنبشی آنها گسترش یافته است نشان می دهد، اما برای یافتن همبستگی بین مراحل یونیزاسیون و گشتاور یونی نیاز به محاسبه یک نقشه کوواریانس است.
در مثال شکل 1 طیف و یکسان هستند، با این تفاوت که محدوده زمان پرواز متفاوت است. پنل a نشان می دهد ، پنل b را نشان می دهد و پنل c تفاوت آنها را نشان می دهد که است (به تغییر در مقیاس رنگ توجه کنید). متأسفانه، این نقشه توسط همبستگیهای غیر جالب و معمولی که توسط شدت لیزر در نوسان از عکسی به عکس دیگر ایجاد میشود، غرق شده است. برای سرکوب چنین همبستگی هایی شدت لیزر در هر شات ثبت می شود، قرار داده می شود و و به عنوان پانل های d و e محاسبه می شود. با این حال، سرکوب همبستگیهای جالب ناقص است زیرا منابع دیگری از نوسانات حالت معمولی غیر از شدت لیزر وجود دارد و در اصل همه این منابع باید به صورت بردار بررسی شوند. با این حال در عمل اغلب کافی است که اصلاح کوواریانس جزئی را جبران کنیم همانطور که پانل f نشان می دهد، جایی که همبستگی های جالب لحظه ای یون اکنون به وضوح به صورت خطوط مستقیم متمرکز بر مراحل یونیزاسیون نیتروژن اتمی قابل مشاهده است.
طیفسنجی دو بعدی مادون قرمز از تجزیه و تحلیل همبستگی برای بدست آوردن طیفهای دوبعدی فاز متراکم استفاده می کند. دو نسخه از این تحلیل وجود دارد: همزمان و ناهمزمان . از نظر ریاضی، اولی بر حسب ماتریس کوواریانس نمونه بیان میشود و این تکنیک معادل نگاشت کوواریانس است. [۴]
↑W J Krzanowski "Principles of Multivariate Analysis" (Oxford University Press, New York, 1988), Chap. 14.4; K V Mardia, J T Kent and J M Bibby "Multivariate Analysis (Academic Press, London, 1997), Chap. 6.5.3; T W Anderson "An Introduction to Multivariate Statistical Analysis" (Wiley, New York, 2003), 3rd ed., Chaps. 2.5.1 and 4.3.1.
↑L J Frasinski "Covariance mapping techniques" J. Phys. B: At. Mol. Opt. Phys.49 152004 (2016), open access
↑O Kornilov, M Eckstein, M Rosenblatt, C P Schulz, K Motomura, A Rouzée, J Klei, L Foucar, M Siano, A Lübcke, F. Schapper, P Johnsson, D M P Holland, T Schlatholter, T Marchenko, S Düsterer, K Ueda, M J J Vrakking and L J Frasinski "Coulomb explosion of diatomic molecules in intense XUV fields mapped by partial covariance" J. Phys. B: At. Mol. Opt. Phys.46 164028 (2013), open access
↑I Noda "Generalized two-dimensional correlation method applicable to infrared, Raman, and other types of spectroscopy" Appl. Spectrosc.47 1329–36 (1993)