А.С. Холево - Введение в квантовую теорию информации (1156787), страница 10
Текст из файла (страница 10)
. . , n. Над системой можно производить произвольное измерение.Требуется найти оптимальную процедуру измерения, позволяющую наилучшим образом выяснить, в каком из этих состояний находится система.Такая постановка задачи характерна для теории связи и для математической статистики.Измерение (приемник) будет описываться наблюдаемой, т. е.
разложением единицы M = {Mk }. Вероятность принять решение k, при условии, чтобыл послан сигнал j, при этом равна pM (k|j) = Tr Sj Mk . Если был послансигнал j, то вероятность того, что было принято правильное решение, естьpM (j|j). Примем дополнительное предположение, что сигнал j появляетсяс вероятностью πj (например, в случае равновероятных сигналов πj = 1/n.)1 К. Шеннон, Статистическая теория передачи электрических сигналов, в кн. “Теорияпередачи электрических сигналов при наличии помех”, М.: ИЛ, 1953, 7-87.52Глава 4. КЛАССИЧЕСКИ-КВАНТОВЫЕ КАНАЛЫТогда средняя вероятность правильного решенияP{M } =nXπj pM (j),j=1а средняя вероятность ошибки равна 1 − P{M }, и задача состоит в ее минимизации, или же в максимизации P{M }.
В статистике применяется иминимаксный критерий, когда минимизируется maxj pM (j| j), но мы его небудем здесь затрагивать.Другой важный критерий, который мы рассмотрим позже, – шенноновская информация. Согласно формуле (4.7) количество взаимной информации между входом J (j — номер входного состояния) и выходом K (k —номер решения) дается формулойJ {M } = H(K) − H(K|J)| {z }| {z }энтропия=−XXkусловнаяэнтропияpM (k|j)πj logXjpM (k|l)πl +jl=Xj4.2.2XπjXkπjXkpM (k|j) log pM (k|j)p (k|j) ,pM (k|j) log P MpM (k|l)πllРазличение по максимумуправдоподобияБудем максимизировать вероятность правильного решенияP{M } =nXnXπj Tr Sj Mj = Tr(πj Sj Mj ).| {z }j=1j=1WjМножество наблюдаемых, по которым ведется оптимизация()nXMk = IMn = M = {Mk }k=1,...,n : Mk ≥ 0,k=1— выпуклое.
Смесь (выпуклая комбинация) наблюдаемых описывает статистику измерения, производимого прибором с флуктуирующими параметрами. Функция P{M } аффинна, т.е.nXo XPpλ P{M λ }.pλ M λ =Оптимизация аффинной функции, заданной на выпуклом множестве — типичная задача линейного программирования.4.2. ОПТИМАЛЬНОЕ РАЗЛИЧЕНИЕ КВАНТОВЫХ СОСТОЯНИЙ 53Т е о р е м а 13. Средняя вероятность правильного решения P{M } достигает максимума в крайней точке множества Mn . Наблюдаемая M 0оптимальна тогда и только тогда, когда найдется эрмитов оператор Λ0такой, что1) (Λ0 − Wk )Mk0 = 0;2) Λ0 ≥ Wk .При этом имеет место соотношение двойственностиmax{P{M } : M ∈ Mn } = min{Tr Λ : Λ ≥ Wk , k = 1, . .
. , n}.(4.20)Доказательство. Докажем достаточность условий теоремы.Пусть наблюдаемая M 0 удовлетворяет этим условиям, M ∈ Mn — произвольная наблюдаемая, тогдаP{M } = TrX2)Wk Mk ≤ TrXΛ0 Mkkk1)= Tr Λ0 = TrXWk Mk0 P{M 0 }.kЗдесь был использован простой факт:З а д а ч а 17. Для B ≥ 0 в B(H) и A1 , A2 , таких что A1 ≤ A2 , имеет местоTr A1 B ≤ Tr A2 B, причем равенство имеет место тогда и только тогда, когдаA1 B = A2 B.Докажем необходимость условий теоремы.2Положимk = Xk , где Xk эрмитовы операторы, удовлетворяющиеP M2условию k Xk = I.
Применяя метод Лагранжа, сводим задачу максимизации P{M } на множестве Mn к нахождению максимума функцииXXTrWk Xk2 − Tr Λ(Xk2 − I),(4.21)kkгде Λ эрмитов оператор, по всевозможным наборам эрмитовых операторовXk . Пусть Xk0 оптимальный набор, положим Xk = Xk0 + ²Yk , и рассмотрим(4.21) как функцию от ². Рассматривая коэффициенты при ² и ²2 , получаемусловияTr[(Wk − Λ)Xk0 + Xk0 (Wk − Λ)]Yk = 0,Tr(Wk − Λ)Yk2 ≤ 0для произвольных эрмитовых Yk , т.е.(Wk − Λ)Xk0 + Xk0 (Wk − Λ) = 0,Λ − Wk ≥ 0.54Глава 4. КЛАССИЧЕСКИ-КВАНТОВЫЕ КАНАЛЫВторое неравенство есть условие 2) теоремы. Полагая Mk0 = (Xk0 )2 , получаем из первого соотношения Tr(Λ − Wk )Mk0 = 0, что вместе со вторымнеравенством влечет условие 1).З а д а ч а 18.
Доказать, что операторный множитель Лагранжа Λ является единственным решением двойственной задачи в правой части (4.20).Проиллюстрируем смысл и полезность этих условий на нескольких примерах. Рассмотрим сначала классический случай, когда операторы плотности состояний коммутируют.П р и м е р 1. Пусть операторы Wk (пропорциональные Sk ) коммутируют,тогда существует общий ортонормированный базис, где они все диагонализуютсяXWk =Wk (ω)|ωihω|.ωТогда можно взятьΛ0 =Xωmax Wk (ω)|ωihω|,kгде max Wk (ω) — верхняя огибающая функций Wk (ω); k = 1, . . .
, n; Mk0 =P k1Ωk (ω)|ωihω|; 1Ωk обозначает индикатор подмножества Ωk , и подмножеωства Ωk ⊂ {ω : Λ0 (ω) = Wk (ω)} образуют разбиение множества Ω = {ω}.Это приводит к принципу максимального правдоподобия в классическойстатистике: k-е решение необходимо принимать для тех ω, для которыхWk (ω) максимально. Таким образом, в классическом случае оптимальнаянаблюдаемая всегда может быть выбрана нерандомизованной. Это прямосвязано с тем фактом, что в коммутативном случае крайние точки множества Mn отвечают ортогональным разложениям единицы (см. задачу 7).e1П р и м е р 2 ( У п р а ж н е н и е 19 ).
Раз¡µ3́ψ16´личение двух квантовых состояний. Про´¡извольная наблюдаемая с двумя значениQ@Q ψ0sQями имеет вид M = {M0 , M1 }, M0,1 ≥Re@00, M1 = I − M0 , причем стандартныеРис. 4.2: Различение двух чи- наблюдаемые характеризуются условиемM02 = M0 , которое в точности соответстых состояний.ствует крайним точкам "некоммутативного отрезка"M2 = {0 ≤ M0 ≤ I} (задача 20 ). Таким образом, для различениядвух состояний достаточно стандартных наблюдаемых.Приведем явное решение. Пусть S0 , S1 произвольные операторы плотности. Оператор ЛагранжаΛ = π0 S0 M0 + π1 S1 M1 = π1 S1 + (π0 S0 − π1 S1 )M0эрмитов, поэтому [M0 , π0 S0 − π1 S1 ] = 0.
Неравенство Λ ≥ π1 S1 влечет(π0 S0 − π1 S1 )M0 ≥ 0, a из Λ ≥ π0 S0 вытекает(π0 S0 − π1 S1 )M0 ≥ (π0 S0 − π1 S1 ).4.2. ОПТИМАЛЬНОЕ РАЗЛИЧЕНИЕ КВАНТОВЫХ СОСТОЯНИЙ 55Очевидным решением является M0 = 1(0,∞) (π0 S0 − π1 S1 ), т. е. проектор насобственное подпространство оператора π0 S0 − π1 S1 , отвечающий положительным собственным значениям. При этомmax P{M } = Tr[π1 S1 + (π0 S0 − π1 S1 )+ ] =1[1 + kπ0 S0 − π1 S1 k1 ],2где kT k1 = Tr |T | –ядерная норма оператора T .
Здесь |T | = T+ + T− , гдеT+ (T− ) положительная (отрицательная) часть эрмитова оператора T , т.е. компонента его спектрального разложения, отвечающая положительной(отрицательной) части спектра.Пусть S0 = |ψ0 ihψ0 |, S1 = |ψ1 ihψ1 |. В этом случае оптимум дается ортонормированным базисом {|e0 i, |e1 i}, так что M0 = |e0 ihe0 |, M1 = |e1 ihe1 |.Вектор |e0 i отвечает положительному собственному числу λ0 оператораπ0 |ψ0 ihψ0 | − π1 |ψ1 ihψ1 |, причем max P{M } = π1 + λ0 . Диагонализуя оператор π0 |ψ0 ihψ0 | − π1 |ψ1 ihψ1 |, можно дать явное решение задачи (см.
[8]).Пусть для простоты π0 = π1 = 1/2 , тогда оптимальный базис расположенсимметрично по отношению к |ψ0 i, |ψ1 i (рис. 4.2) и´p1³max P{M 0 } =1 + 1 − | hψ1 |ψ0 i| 2 .2З а д а ч а 21. Показать, что для различения n чистых состояний с линейно независимыми векторами |ψj i; j = 1, .
. . , n, достаточно стандартныхнаблюдаемых. В этом случае оптимальная наблюдаемая дается вектораминекоторой ортонормированной системы |ej i; j = 1, . . . , n, см. [8].П р и м е р 3 . На плоскости (рассматриваемой каквещественноеподпространство двумерного унитарноψ1го пространства) рассмотрим “равноугольную” конAKAфигурацию трех векторов (рис. 4.3)A"#cos 2jπA-ψ03|ψj i =, j = 0, 1, 2.(4.22)¢sin 2jπ3¢¢Соответствующие операторы плотности Sj = |ψj ihψj |,¢®описывают состояния двухуровневой системы, наприψ2мер, плоскополяризованного фотона или частицы соРис.
4.3: Векторы спином 1/2.трех состоянийИмеем·Sj =cos2 2jπ32jπcos 2jπ3 sin 3¸2jπcos 2jπ3 sin 3sin2 2jπ3µ·1cos 4jπ3=I+sin 4jπ23Поскольку2Xj=0ei4jπ3= 0,sin 4jπ3cos 4jπ3¸¶.(4.23)56Глава 4. КЛАССИЧЕСКИ-КВАНТОВЫЕ КАНАЛЫто2Xj=0Mk0Sj =3I,223 Skто есть=является разложением единицы.Покажем, что в случае равновероятных состояний, πj = 1/3, {Mk0 } даетоптимальную наблюдаемую. Проверим условия теоремы. Поскольку Sj2 =Sj , то22X2X1 21Λ0 =Sj Sj =Sj , = I.3 39 j=03j=0так что I/3 = Λ0 ≥ Sj /3 (условие 2)) иµ¶1120Λ − SjSj = (I − Sj )Sj = 0333— условие 1) также выполнено.Итак, max P{M } = Tr Λ0 = 2/3.
Найдем теперь максимум по всевозможным стандартным наблюдаемым с тремя значениями. Нетривиальноеортогональное разложение единицы с тремя компонентами в двумерномпространстве имеет вид M0 = |e0 ihe0 |, M1 = |e1 ihe1 |, M2 = 0, где |e0 i, |e1 i,– произвольный базис. Находя соответствующий максимум, получаем√1 + 3/22maxP{M } =< = max P{M }.M −стандартные33 M ∈MТаким образом, использование в квантовой статистике неортогональныхразложений единицы в качестве наблюдаемых (т.е. использование квантовой рандомизации — дополнительной независимой квантовой системы вфиксированном состоянии) может приводить к выигрышу при различениисостояний исходной системы! Подчеркнем, что в классическом случае никакая рандомизация не может улучшить качество процедуры различениясостояний.С геометрической точки зрения, причина состоит в том, что в квантовомслучае не все крайние точки множества наблюдаемых M3 (среди которыхи находится наиболее информативная наблюдаемая), описываются ортогональными разложениями единицы.4.2.3Максимум информацииПусть система находится в одном из m состояний S1 , .
. . , Sm , и над системойпроизводится измерение наблюдаемой M = {Mk }; k = 1, . . . , n, с цельюполучить максимальное количество информации. Число исходов измеренияn заранее не фиксировано. A priori нет оснований требовать совпадения nи m. Множество всех наблюдаемых с конечным числом исходов обозначимM.4.2. ОПТИМАЛЬНОЕ РАЗЛИЧЕНИЕ КВАНТОВЫХ СОСТОЯНИЙ 57Таким образом, есть переходная вероятность pM (k|j) = Tr Sj Mk , и шенноновское количество информации дается формулойhiX XXJ {M } =πjpM (k|j) log pM (k|j) − logpM (k|l)πl ,(4.24)jklгде πj — априорные вероятности состояний.Л е м м а 5. J {M } — выпуклая функция на M, т.е.J {pM (1) + (1 − p)M (2) } ≤ pJ {M (1) } + (1 − p)J {M (2) }.В силу аффинной зависимости переходной вероятности от M , достаточно доказать, что J {M } является выпуклой функцией от переходнойвероятности.
Это вытекает из следующего общего свойства.Л е м м а 6. Шенноновское количество информации J {M } является выпуклой функцией от переходных вероятностей p(k|j) и вогнутой функцией от априорных вероятностей πj .Ограничимся доказательством первого утверждения, а второеоставим в качестве упражнения.0,Доказательство. Рассмотрим множество переходных вероятностей p(k|j) ≥Pp(k|j) = 1.
ИмеемkJ {M } =XXhiXp(k|j)πj log p(k|j) − logp(k|l)πl .jklДостаточно доказать выпуклость по переменным x для любого фиксированного k следующих функцийhiXXp(k|l) πl ) ,p(k|j) πj log p(k|j) − log(| {z }| {z }| {z }jl|||||||||xjxjxlпоскольку количество информации является суммой слагаемых видаhiXXf (x) =πj xj log xj − logxl πl .jlДифференцируя по xj , получаемhiX∂f (x)= πj (1 + log xj ) − (1 + logxl πl )∂xjl(здесь для простоты log — натуральный логарифм) и∂ 2 f (x)πjπj πk= δkj−P;∂xj ∂xkxjπl xllXj,kPX πj( j πj cj )2∂ 2 f (x)2cj ck=cj− P.∂xj ∂xkxjl πl xlj58Глава 4.
КЛАССИЧЕСКИ-КВАНТОВЫЕ КАНАЛЫСогласно неравенству Коши-Буняковского,XX √XX πlcjπj cjπj xj √ ≤πl xlc2j ,xxjljчто и доказывает выпуклость функции f , а значит, и шенноновской информации.З а д а ч а 22. Максимум непрерывной выпуклой функции на компактном выпуклом множестве достигается в крайней точке этого множества.Таким образом, надо исследовать крайние точки множества M.Л е м м а 7. Если наблюдаемая M 0 получена укрупнением исходов наблюдаемой M , то J {M 0 } ≤ J {M }.Доказательство. Достаточно показать, что если два исхода j1 , j2 наблюдаемой M объединить в один, не трогая остальных (к таким операциямсводится последовательно любое укрупнение), тоhiXpM (j1 |i) log pM (j1 |i) − logpM (j1 |l)πl +lhiX+pM (j2 |i) log pM (j2 |i) − logpM (j2 |l)πl ≥h≥{pM (j1 |i) + pM (j2 |i)}|{z}l³´log pM (j1 |i) + pM (j2 |i) −Отвечает одному исходу в M 0− logX³´iπl pM (j1 |i) + pM (j2 |i)lВведем множитель 1/2:11p (j1 |i)[.