18.1Обратные функции

18.1.1Определение обратного отображения

Пусть отображение f:X→Y инъективно, то есть не склеивает
точки. Если представить себе его в виде картинки со стрелочками (см.
рис. 18.1 слева), это будет
означать, что нет двух стрелочек, приходящих в один и тот же элемент множества
Y. Обратим направления всех стрелочек (тот же рис. справа).

Теперь из некоторых (но может быть не
всех) точек множества Y выходит по одной стрелочке, ведущей в X. Так мы
получили новое отображение. Оно называется обратным к отображению f и
обозначается f−1.

Не нужно путать верхний индекс −1, который здесь используется, с обычной
минус первой степенью. Иными словами,

f−1(x)≠1f(x).

Какова область определения f−1? Это множество всех точек X, в которые
входит стрелочка, соответствующая отображению f. Иными словами, это множество
тех точек, в которые переходят какие-то точки из X, то есть полный образ
X под действием f. Он обозначается f(X):
f(X):={f(x)∣x∈X}⊂Y;f−1:f(X)→X.
Если отображение f биективно, то f(X)=Y и обратное
действует из Y в X.

Как записать формально, что значит, что мы «обратили стрелочки»? Возьмём любую
точку x∈X. Подействуем на неё отображеним f, получим точку f(x)∈Y.
Теперь подействуем на f(x) отображением f−1. Мы обязаны вернуться в x.
Итак, можно дать формальное определение.

Определение 1. Пусть f:X→Y — некоторое инъективное отображение. Отображение
g:f(X)→X называется обратным к отображению f, если для
всякого x∈X

g(f(x))=x.

В этом случае g обозначается через f−1.

18.1.2Обратимость и графики функций

Рассмотрим функцию f, заданную графиком. Как понять, является ли она обратимой
(то есть инъективной)? Для этого надо провести всевозможные горизонтальные
прямые и посмотреть на их точки пересечения с графиком y=f(x), см.
18.2. Если есть горизонтальные прямые, пересекающие график
в двух и более точках, функция необратима. Действительно, пусть прямая y=c
пересекает график y=f(x) в двух точках: (x1,c) и (x2,c), x1≠x2. Тогда по определению графика, это означает, что f(x1)=c и f(x2)=c, и
значит функция необратима.

Если же все горизонтальные прямые пересекают график не более, чем в одной точке,
обратная функция существует, см. рис. 18.3. Если прямая
y=c не пересекает график функции f вообще, это означает, что точка c не
лежит в области значений f и обратная функция в ней не определена. Если прямая
y=c пересекает график ровно в одной точке, обозначим эту точку через (x1,c). Тогда f(x1)=c и стало быть f−1(c)=x1. Таким образом мы однозначно
определили f−1 во всех точках, в которых эта функция определена.

Пример 1. Рассмотрим функцию f:R→R, f(x)=x2. Является
ли эта функция обратимой? Нет, не является: например, прямая y=1
пересекает график в двух точках: (−1,1) и (1,1), см.
рис. 18.4 слева.

Рис. 18.4: Функция f(x)=x2 не является обратимой всюду, но становится
обратимой, если её ограничить на неотрицательные числа

Однако, можно рассмотреть ограничение функции f на подмножество [0,+∞), то есть рассмотреть новую функцию ~f, заданную следующим
образом:
~f:[0,+∞)→R,∀x∈[0,+∞):~f(x)=g(x).
Обозначают ~f=f|[0,+∞).
Графиком ~f будет правая ветвь параболы (см. тот же рисунок,
справа), и, в отличие от исходной функции f, функция ~f является
обратимой. Её обратной является квадратный корень (вернее, арифметический
квадратный корень): ~f−1(y)=√y. Областью определения
обратной является множество [0,+∞), поскольку квадраты вещественных
чисел неотрицательны.

Вопрос 1. Найдите обратную к функции f|(−∞,0], то есть ограничению f на
множество неположительных чисел.

  √x

Нет, потому что если x=−2, √x2=√4=2≠−2, то
есть мы не вернулись в ту точку, из которой вышли.

  √−x

Нет. Подсказка: область определения обратной должна совпадать с областью
значения исходной функции, а область значений исходной функции
— все неотрицательные числа.

  −√x

Верно, да. Для всех x≤0, (−√x)2=x.

  −√−x

Нет. Подсказка: область определения обратной должна совпадать с областью
значения исходной функции, а область значений исходной функции
— все неотрицательные числа.

Вопрос 2. Рассмотрим функцию f:R→R:

f(x)=√x2

Верно ли, что f(x)=x для всех вещественных x?

  Верно, посколько корень и возведение в квадрат — взаимно обратные
функции, см. замечание 1.

Нет. Найдите f(−1).

  Нет, поскольку функция в левой части определена только для
неотрицательных x.

Да нет, вообще нет никаких проблем найти f(−1). Попробуйте!

  Неверно, получатся разные функции.

Так и есть! При неотрицательных x равенство верно, а при x<0,
x2=(−x)2 и √x2=√(−x)2=−x (поскольку корень
обязан принимать неотрицательные значения). Значит,
√x2=|x|.

Пример 2. Функция f(x)=sinx также не является обратимой на всей области
определения, но её ограничение на отрезок [−π/2,π/2] обратимо.
Обратная к этому ограничению называется арксинусом:

arcsin:[−1,1]→[−π/2,π/2].

Рис. 18.5: Синус не является обратимой функцией, но его ограничение на
[−π/2,π/2] обратимо

Вопрос 3. Найдите обратную к функции sin|[−3π/2,−π/2].

  arcsin(y+π)

Не-не-не, и у арксинуса, и у нашей обратной функции область
определения [−1,1], никакого π добавлять к аргументу не
нужно.

  arcsin(y)+π

Множеством значений обратной функции является область
определения исходной. Например, если подставить y=0, получится
π, что лежит вне области определения нашей функции.

  −arcsin(y)−π

Верно! Наверное, самый разумный способ понять, какой ответ
правильный, такой: построить график, провести горизонтальную
прямую y=c и отметить две точки на графике: одна соответствует
arcsin(c), а другая — искомой обратной функции. И понять, как
связаны их x-координаты.

  arcsin(y)−π

Возьмём, например, y=1. Чему равняется sin(arcsin(1)−π)?

18.1.3Графики прямой и обратной функции

Если выбрать одинаковые масштабы горизонтальной и вертикальной оси и нарисовать
на одной и той же картинке графики функций y=x2, x≥0 и y=√x, мы
увидим, что они получаются друг из друга отражением относительно прямой y=x,
см. рис. 18.6 слева.
Это неудивительно: чтобы превратить график x2 в √x, нужно поменять
ролями вертикальную и горизонтальную оси, и отражение относительно y=x делает
именно это. Можно представить себе, что наша картинка нарисована на прозрачной
плёнке. Мы подняли её и повернули вокруг оси вращения, проходящей через прямую
y=x, а затем снова положили на стол. При этом координатная ось Ox легла на
место координатной оси Oy и наоборот, а кусочек параболы лёг на место графика
квадратного корня. То же самое происходит и с арксинусом (см. тот же рисунок,
справа).

Рис. 18.6: Примеры графиков функций и их обратных

Утверждение 1. Аналогичное утверждение будет верным и для любых других пар взаимно обратных
функций f и f−1.

Доказательство. Для формального доказательства нам понадобится немножко школьной
планиметрии, см. рис. 18.7.

Рис. 18.7: Иллюстрация к доказательству утверждения о симметрии графиков

Возьмём любую точку P=(x,f(x)) на графике y=f(x). Точка P′=(f(x),x)
будет принадлежать графику обратной функции, поскольку f−1(f(x))=x.
Пусть A=(0,f(x)) и A′=(f(x),0). Рассмотрим треугольники OPA и
OP′A′. Это прямоугольные треугольники, они равны по двум сторонам
(|OA|=|OA′|, |AP|=|A′P′|). Значит, |OP|=|OP′| и треугольник OPP′
равнобедренный. Прямая y=x является биссектрисой угла POP′, поскольку
она является биссектрисой прямого угла AOA′ и углы AOP и A′OP′ равны.
Значит, она является медианой и высотой треугольника OPP′. Значит отрезок
PP′ перпендикулярен бисектриссе и разбивается ей на равные отрезки. Это и
означает, что точки P и P′ симметричны относительно прямой y=x.∎

18.1.4Обратные функции и непрерывность

Утверждение 2. Пусть функиця f строго возрастает (убывает) и обратима. Тогда обратная
функция строго возрастает (убывает).

Доказательство. Рассмотрим случай когда f строго возрастает (обратный случай
рассматривается аналогично). Пусть f−1 не является строго возрастающей
функцией. Тогда найдутся точки y1 и y2, y2>y1, для которых
f−1(y2)<f−1(y1) (равенства быть не может в силу обратимости).
Но в силу возрастания f тогда

f((f−1(y2))<f(f−1(y1)).

По определению обратной функции (см. замечание 1),
f(f−1)(y2)=y2 и f(f−1)(y1)=y1. Значит y2<y1 вопреки
предположению.∎

Читайте также:  Каким свойством обладает мел

Утверждение 3. Пусть функция непрерывна на [a,b] и обратима. Тогда f строго
монотонна на [a,b].

Доказательство. От противного. Пусть f(b)>f(a), обратный случай рассматривается аналогично.
Поскольку функция по предположению не является монотонной, она в частности не является
строго возрастающей.
Значит, найдутся такие точки x1,x2∈[a,b], что x2>x1 и
f(x2)≤f(x1). Равенства на самом деле быть не может в силу
инъективности f. Таким образом, f(x2)<f(x1). Возможно два
варианта.

Рис. 18.8: Иллюстрация к доказательству утверждения о монотонности обратимых
непрерывных функций

  1. Пусть f(x1)>f(a), см. рис. 18.8 слева.
    Пусть y∗∈(max(f(a),f(x2)),f(x1)). По теореме о
    промежуточном значении на [a,x1]
    найдётся такая точка c1, что f(c1)=y∗. По той же теореме на
    [x1,x2] найдётся такая точка c2, что f(c2)=y∗.
    Противоречие с обратимостью.
  2. Пусть f(x1)<f(a) (см. тот же рисунок, справа). Тогда аналогичное
    рассуждение можно применить к точкам x1, x2, b. (Примените!)

Вопрос 4. На каком интервале нужно выбирать y∗ при рассмотрении второго случая?

  y∗∈(f(x2),max(f(x1),f(b)))

А вот и не максимум.

  y∗∈(f(x2),min(f(x1),f(b)))

Верно!

Следствие 1. Пусть областью определения функции f является отрезок [a,b], функция
непрерывна и обратима и [x1,x2]⊂[a,b]. Тогда образом отрезка
[x1,x2] под действием f является отрезок с концами в точках f(x1)
и f(x2) (то есть [f(x1),f(x2)] или [f(x2),f(x1)], в зависимости
взаимного расположения f(x1) и f(x2)).

Доказательство. Нам нужно доказать два утверждения:

  1. Все точки y между f(x1) и f(x2) являются образами каких-то
    точек x∈[x1,x2].
  2. Никакие другие точки не являются образами точек x∈[x1,x2].

Докажем первое утверждение. Все значения y между f(x1) и f(x2) принимаются по
теореме о промеужточном значении. Доказали.

Докажем второе. Если x1≤x≤x2 и функция строго возрастает, то
f(x1)≤f(x)≤f(x2), а если строго убывает,то f(x1)≥f(x)≥f(x2). В обоих случаях f(x) принадлежит отрезку с концами в точках
f(x1) и f(x2), и это верно для всякого x∈[x1,x2]. Тоже
доказали.∎

Следствие 2. Пусть областью определения функции f являтеся отрезок [a,b], функция
непрерывна и обратима. Пусть также [y1,y2] лежит в области значений f.
Тогда прообразом этого отрезка под действием f, то есть множеством

f−1([y1,y2]):={x∈[a,b]:f(x)∈[y1,y2]}

будет отрезок I с концами в точках f−1(y1) и f−1(y2).

Упражнение. Докажите это следствие.

  Узнать ответ

По утверждению 2 обратная функция монотонна. Значит
для всех y∈[y1,y2], f−1(y) лежит между точкам f−1(y1) и
f−1(y2). То есть у любой точки y есть единственный прообраз (это
следует из обратимости), и он лежит на отрезке I (это следует из
монотонности). Значит, никакая точка вне этого отрезка не лежит в
f−1([y1,y2]). Наоборот, любая точка x∈I под действием f
переходит в точку отрезка [y1,y2] (в силу монотонности f), и значит
все такие точки x лежат в f−1([y1,y2]).

Упражнение 1. Приведите контрпримеры, демонстрирующие, что требования непрерывности и
обратимости являются существенными для двух доказанных выше следствий, то
есть что если хотя бы одно из них нарушается, утверждения перестают быть
верными. Пока вы этого не сделали, вы не можете считать, что понимаете
доказательства.

Утверждение 4. Пусть f непрерывна на [a,b] и обратима. Тогда f−1 также
непрерывна.

Доказательство. Пусть для определённости f(b)>f(a) (обратный случай рассматривается
аналогично). Тогда функция обязана возрастать: она будет монотонной в силу
обратимости, но убывать не может. Рассмотрим точку y0∈(f(a),f(b)) и
докажем, что f−1 непрерывна в y0 (односторонняя непрерывность в
концах отрезка доказывается аналогично). Пусть y0=f(x0). Мы хотим
доказать, что

limy→y0f−1(y)=f−1(y0)=x0.

Рис. 18.9: Иллюстрация к доказательству утверждения о непрерывности обратной к
непрерывной функции

Для всякого ε>0 рассмотрим интервал Uε(x0)=(x0−ε,x0+ε), см. рис. 18.9. Нам нужно доказать, что
найдётся такая окрестность ˚Uδ(y0), что все точки из этой
окрестности перейдут в Uε(x0) под действием обратного отображения
f−1. (Поскольку мы рассматриваем обратное отображение, мы, вопреки
обыкновению, ε-окрестности рисуем на горизонтальной оси, а
δ-окрестности — на вертикальной.) Будем считать, что ε
достаточно мало, чтобы Uε целиком лежал в интервале (a,b). По
следствию 1 и замечанию 2, образом
Uε под действием f является интервал V:=(f(x0−ε),f(x0+ε))
(он непуст, поскольку мы рассматриваем случай, когда f возрастает, и
значит правый конец будет правее левого). Поскольку y0=f(x0), y0∈V (в силу монотонности функции f), то есть V является окрестностью
точки y0. Поскольку под действием f окрестность Uε(x0) переходит
в окрестность V, то под действием обратного отображения f−1
окрестность (f(x0−ε),f(x0+ε)) перейдёт назад в Uε(x0).

Итак, мы получили окрестность точки f(x0), все точки из которой переходят
в ε-окрестность точки x0 под действием f−1. Это почти то, что
нам нужно. Давайте впишем в неё какую-то симметричную окрестность — она и
будет искомой δ-окрестностью (это немножко технический шаг, но в
определении предела мы используем симметричные окрестности, и нам формально
нужно получить именно такую).

Пусть δ=min(|y0−f(x0−ε)|,|y0−f(x0+ε)|)>0.
Тогда Uδ(y0)⊂(f(x0−ε),f(x0+ε)) и
f−1(Uδ(y0))⊂(x0−ε,x0+ε)=Uε(x0). (Если
всё множество V отображалось под действием f−1 в Uε(x0), то
подмножество V отображается в некоторое подмножество Uε(x0).
Таким образом, для любого y∈Uδ(y0), f−1(y)∈Uε(x0). Тем самым, построенная нами δ
удовлетворяет условию в определении искомого предела.∎

Пример 3. Мы знаем, что функция f(x)=expx=ex непрерывна и строго монотонна, её
областью определения является вся прямая и она принимает все положительные
значения. Значит, у неё существует непрерывная обратная. Она называется
натуральным логарифмом:

ln:(0,+∞)→R.

Для всех x∈R, lnex=x. Наоборот, для всех y>0, elny=y. Натуральный логарифм, так же, как и экспонента, монотонно возрастает.

Рис. 18.10: Графики экспоненты и натурального логарифма

18.2Производная обратной функции

18.2.1Мотивировка и формула

Будем использовать ту же интерпретацию производных, как в доказательстве
теоремы о производной сложной функции.

Рассмотрим две оси, x и y. Пусть f(x0)=y0. Рассмотрим небольшой отрезок
I=[x0,x0+Δx] на оси x и его образ под действием f: отрезок
f(I)=[f(x0),f(x0+Δx)] на оси y. (Для иллюстрации будем считать,
что f возрастает и Δx>0.) Тогда производная f′(x0) показывает, во
сколько (примерно) раз f(I) длиннее I, то есть во сколько раз отрезок I
растягивается отображением f, то есть f′(x0)≈|f(I)|/|I|.

Рис. 18.11: Производная функции f показывает, во сколько раз растягивается
маленький отрезок. Если f растягивает, то f−1 будет сжимать, то
есть производная обратной функции обратна к производной прямой функции.
Главное — разобраться, в каких точках эти производные нужно считать.

Посмотрим теперь на обратное отображение f−1. Оно переводит отрезок f(I)
назад в отрезок I. Когда I маленький, f(I) тоже маленький. Поэтому
(f−1)′(y0)≈|I|/|f(I)|. Обратите внимание: нам нужно брать
производную в точке, которая является концом отрезка f(I), то есть в точке
y0. Но y0=f(x0). Таким образом, можно ожидать, что

(f−1)′(f(x0))=1f′(x0).

Эту формулу мы и будем доказывать.

18.2.2Аккуратная формулировка и доказательство

Теорема 1. Пусть функция f непрерывна в окрестности точки x0 и дифференцируема
в x0. Пусть также f′(x0)≠0 и f обратима. Тогда f−1
дифференцируема в точке y0=f(x0) и

(f−1)′(f(x0))=1f′(x0).

Поскольку x0=f−1(y0), это равенство можно записать так:

(f−1)′(y0)=1f′(f−1(y0)).

Доказательство. Для упрощения формул будем обозначать f−1 через g.
Рассмотрим предел, используемый в определении производной функции
g в точке y0:

limΔy→0g(y0+Δy)−g(y0)Δy.(18.2)

Рассмотрим функцию

Δg(Δy)=g(y0+Δy)−g(y0).

В силу непрерывности g, Δg(Δy)→0 при Δy→0. Также Δg(Δy)≠0 при Δy≠0, иначе у одной точки x0 было бы два образа под действием f.
Заметим, что справедливо тождество (см. рис. 18.12):

Δy=f(x0+Δg(Δy))−f(x0).

Рис. 18.12: Иллюстрация к доказательству теоремы о производной обратной функции

Запишем теперь предел (18.2) в следующем виде:

limΔy→0g(y+Δy)−g(y)Δy=limΔy→0Δg(Δy)Δy=limΔy→01ΔyΔg(Δy)=limΔy→01f(x0+Δg(Δy))−f(x0)Δg(Δy)=…(18.3)

Рассмотрим функцию

F(Δx)=f(x0+Δx)−f(x0)Δx.

Тогда можно продолжить равенство (18.3):

…=limΔy→01F(Δg(Δy))=…(18.4)

Поскольку Δg(Δy)→0 при Δy→0 и Δg(Δy)≠0 при Δy≠0, можно воспользоваться теоремой о пределе
сложной функции (см. упражнение 2 из
лекции 13):

limΔy→0F(Δg(Δy))=limΔx→0F(Δx)=f′(x0).

Теперь можно применить теорему о пределе частного к (18.4)
(мы потребовали, чтобы f′(x0)≠0, так что делить можно) и
получить:

…=1limΔy→0F(Δg(Δy))=1f′(x0).

Теорема о пределе обратной функции доказана.∎

Пример 4. Найдём производную натурального логарифма. Известно, что (ex)′=ex.
Рассмотрим обратную функцию x=lny. Имеем:

(lny)′=1(ex)′|x=lny=1elny=1y,

где (ex)′|x=lny означает, что н