полная версия

Замок Дракона

Б   Е   З       Б   А   Ш   Н   И

На главную
/ Архивы Замка Дракона / Лекции ВМиК / Системное программное обеспечение / Лекции 4-6

Лекция 4.

Мы с вами продолжаем обзор свойств архитектуры вычислительной системы. И вновь следует обратить внимание на тот факт, что мы с вами рассматриваем не просто ЭВМ, как набор плат, размещенных на ней микросхем, каких-то проводников, механических устройств и всего прочего, а мы рассматриваем вычислительную систему, то есть то образование, к которому мы уже привыкли — кто-то из вас привык к одному типу и считает, что это почти везде так — есть персональные компьютеры ибольше ничего. Нет, на самом деле вычислительной техники очень много, она разнообразна: она есть большая и маленькая, встроенная и т.д. И мы с вами рассматриваем это, как вычислительную систему — систему, объединяющую аппаратуру и программное обеспечение. Мы рассматриваем это объединение, как систему — как программное обеспечение, оказывает влияние на аппаратуру, и наоборот. Мы с вами уже посмотрели и поговорили на предыдущих лекциях о некоторых таких взаимосвязях, м.б. в некоторых местах я не обращал ваше внимание — сейчас обращаю:

И так далее.

Я еще раз замечаю, что цель наших лекций — это не изучение ОС Unix, которую мы будем рассматривать, и не изучение страничной организации памяти. Наша цель — понимание термина “система” в выражении “вычислительная система”, то есть понимание взаимосвязей внутри некоторого комплекса. Эти связи очень сильные и напутанные, как, например, уже рассмотренные механизмы буферизации или система прерываний. А если мы возьмем какую-нибудь сложную машину, у который не один процессорный элемент, а несколько процессорных элементов, которые работают на одну память, то у нас возникает еще более сложная проблема, например, с той же буферизацией памяти.

И то, что мы с вами рассматриваем на лекциях — это очень простой срез, необходимый для того, чтобы у вас сложилось концептуальное понимание работы системы.

Прошлую лекцию мы закончили рассмотрением некоторых типовых внешних запоминающих устройств. Мы рассмотрели такие устройства, как магнитный барабан (МБ) и магнитный диск (МД), выяснили их отличия. Самоцель наших лекций — не изучить работу магнитного барабана, а получить некий инструмент, который позволял бы сравнивать некоторые качества компонент вычислительной системы. Мы выяснили, что внешние ЗУ, такого класса, как МБ и МД, могут характеризоваться степенью проявления механических действий при обработке заказа на обмен. При обмене с МБ — вращение барабана, с МД — добавляется, помимо вращения блина МД, механическое действие по подводу считывающих головок. Чем больше механический движений, тем она медленнее.

Есть еще один экзотический вид памяти — память на магнитных доменах.

Суть этой памяти в следующем:

В магнетизме существует элементарная единица — магнитный домен, одна сторона этой частицы положительна, другая — отрицательна. Существует магнитный барабан, у которого есть треки и головки для чтения и записи. Сам барабан не вращается, а за счет некоторых магнитно-электрических элементов осуществляется перемещение по треку цепочки доменов. При этом каждый домен может быть однозначно ориентирован — это есть кодирование нуля и единицы.

Основанные на таком принципе память очень быстродейственна, за счет отсутствия механических действий. Но эти устройства достаточно специфичны, они используются во встроенных вычислительных системах, в частности, в американских шаттлах используется такой тип памяти.

Итак, мы рассмотрели ВЗУ с точки зрения их эффективности. Давайте посмотрим на них с точки зрения методов доступа.

Суть ЗУ заключается в том, что информация в нем записывается некоторыми блоками или записями. В некоторых устройствах размер блока или записи фиксирован. В других устройствах размер записи произволен и определяется начальным и конечным маркером, который можно программно записать на носитель этого устройства.

В контексте работы с записями и блоками ВЗУ можно разделить на два типа: устройства прямого и последовательного доступа. Разница заключается в том, что при прямом доступе можно считать или записать произвольный блок (например, компакт-диск, МБ, МД и др.), а при последовательном — чтобы добраться до определенной записи требуется просмотр всех предыдущих записей (например, аудио кассета, стриммеры и др.)

Это два взгляда на ВЗУ. Давайте посмотрим на ВЗУ с точки зрения управления.

На ранних стадиях устройство управления ВУ являлось некоторым интерфейсом в получении всех управляющих команд от процессора и передачи их конкретному внешнему устройству. Это означает, что ЦП должен был обрабатывать практически все действия, предусмотренные системой команд управления конкретного устройства. Несмотря на то, что при этом был уже реализован и использовался аппарат прерываний, позволяющий проводить асинхронный обмен, были достаточно большие потери за счет того, что ЦП должен был постоянно прерываться на выполнение небольших по размеру последовательностей команд для управления внешними устройствами. И появились, на самом деле это есть также вычислительные машины, специализированные устройства, которые называются каналами.

Канал — это специализированная вычислительная машина, имеющая внутри себя, процессорный элемент и необходимую память. Канал обычно имеет следующую структуру: у него имеется высокоскоростной канал с памятью основной машины, управляющий канал для взаимодействия с ЦП и имеется некоторое количество каналов для подключения внешних устройств.

Функция канала — выполнение макрокоманд, обеспечивающих ввод-вывод, то есть ЦП подает не последовательность команд (к примеру, такую как — включить шаговый двигатель МД, переместить головку на заданный цилиндр, дождаться нужного сектора, считать блок данных, проверить считанное и т.д.), а команду более общую (произвести обмен данными указанного объема с заданным устройством). Маленькие же команды (перемещение головок, ожидание сектора) выполняет уже канал. В некоторых случаях каналом может являться отдельная специализированная вычислительная машина.

Именно с этого место следует особо подчеркивать терминологию — Центральный Процессор — это основной процессор, ибо помимо него может существовать множество вспомогательных процессоров, обеспечивающих работу с различными компонентами системы. Каналы же обеспечивают обмен с внешними устройствами.

Таким образом каналы разгружают ЦП, при этом сами каналы могут быть достаточно интеллектуальны. Например, за счет собственной памяти в нем может быть организована буферизация, по аналогии с буферизацией при работе с ОЗУ. То есть информация может не сразу записываться на диск, а сосредотачиваться в некотором буфере. Это позволяет минимизировать количество физических обращений к запоминающему устройству, а следовательно, повысить скорость работы с ним.

Соответственно, современные ЭВМ могут иметь множество таких каналов, которые помогают организовывать управление и забирают лишние функции у ЦП.

Это, наверное, все, что можно или нужно было рассказать о работе с внешними устройствами.

Все то, что было сказано — есть лишь небольшие ключики, которые позволяют:

а) как-то классифицировать ВУ и понять, что хорошо, что плохо;

б) постараться сформировать взгляд на все это, как на систему.

 

Мультипрограммный режим

Давайте посмотрим еще один внутрисистемный аспект, который призван продемонстрировать взаимовлияние программного обеспечения и аппаратуры друг на друга. Этот аспект связан с мультипрограммированием.

Начертим следующую диаграмму:

Она показывает работу ЦП во времени.

При счете задачи “1” в какой-то момент ЦП потребовались данные, которые находятся на ВЗУ. Формируется заказ на обмен, но данные сразу не поступают (из-за низкой скорости обмена). И какое-то время ЦП простаивает (разрыв в черте). Далее обмен завершился и программа продолжает выполняться. Но потомвозможен еще такой же запрос к ВЗУ, а потом еще и еще. В зависимости от типа или класса решаемой на вычислительной машине задачи таких простоев может быть до 99% времени выполнения программы, что приводит к неэффективности работы вычислительной системы. Поэтому было бы неплохо при наличии асинхронно работающих устройств в промежутке времени, когда одна программа не может выполняться (например, ожидает данных), запускать другую программу, которая будет “жить” по тем же правилам — она будет выполняться на ЦП, а если ей чего-то не будет хватать, то последует обращение на внешнее устройство с вытекающей отсюда паузой в ее работе. А в эту паузу можно запустить третью программу и т.д.

Режим работы ПО и аппаратуры, обеспечивающий одновременную обработку или одновременное выполнение нескольких программ называется мультипрограммным режимом. Изначально мультипрограммирование появилось в целях максимальной загрузки ЦП, поскольку когда-то это устройство было самым дорогостоящим. На сегодняшний день ЦП, пожалуй, одно из самых дешевых устройств.

Давайте посмотрим, что нужно от аппаратуры вычислительной системы для поддержания мультипрограммирования. Для начала перечислим те проблемы, которые могут возникнуть, начиная с того момента, когда помимо ОС и одной программы пользователя появилась еще одна программа пользователя.

Сначала программа была одна и “творила” все, что хотела — ошибка в программе приводила к ошибке в системе, но кроме самой программы по сути дела больше никто не страдал. А когда на машине появляется еще одна программа, то начинают возникать проблемы:

Кто-то взял и записал в пространство работающей программы свою информацию или

считал из пространства программы какую-то информацию, возможно конфиденциальную.

Итак, первая проблема — проблема защиты памяти. То есть в вычислительной системе должен быть реализован на аппаратном уровне механизм, обеспечивающий защиту адресного пространства программ от несанкционированного доступа других программ. Это означает, что будет в системе механизм, который будет при обеспечении доступа по указанному адресу проверять корректность этого доступа.

На прошлой лекции мы рассматривали механизм виртуальной памяти на примере страничной организации памяти. Таблица приписки, в которой номер строки — номер виртуальной страницы памяти, а содержимое — некоторый код, если он больше, либо равен нулю, то все хорошо — такая страница есть и она приписана некоторой физической странице, и происходит нужное преобразование адреса. Если же код меньше нуля, то это означает, что такой виртуальной страницы нету, и это означает, что срабатывает аппарат защиты памяти. А срабатывает он следующим образом — если код меньше нуля и происходит обращение к данной странице, то в системе автоматически возникает прерывание по защите памяти. При обработке этого прерывания ОС смотрит — действительно ли этого листа нету (действительно ли он чужой) — в этом случае ОС прерывает выполнение процесса, вызвавшего ошибку с соответствующей диагностикой защиты памяти. Может быть другая ситуация — какие-то страницы ещене загружены, и ОС у себя в таблицах отметила, что такая страница есть на самом деле и находится, например, на внешнем устройстве. В этом случае прерывание игнорируется, так как нет достаточной информации для продолжения программы.

Вторая проблема. Пусть, например, имеет место в системе устройство печати. И есть два процесса, сначала один процесс обращается к устройству вывода — напечатать строку из какой-то таблице, которая должна быть выведена на печать, а другой процесс начинает печатать другой документ и тоже обращается к устройству печати. В итоге получается документ, представляющий из себя набор бесполезных строк. Другой пример — таблица приписки в ОС заполняется программно, предположим, что два процесса приписали себе одинаковые страницы памяти — в результате получается неразбериха.

Проблема же заключается в том, что в обоих примерах пользователю были доступны команды управления устройствами (в первом случае — ВУ, во втором — ОЗУ). И вроде как, исходя из наших примеров, это нехорошо. И действительно — организовать процесс мультипрограммирования в таких условиях будет тяжело, ибо какие-либо программы могут оказаться несогласованными, а это в свою очередь приведет к краху системы.

Итак, вторым условием существования мультипрограммирования — наличие привилегированного режим в системе. Это такой режим, в котором программе доступны все возможные команды ЦП. Соответственно, непривилегированный (пользовательский или математический) режим — это такой режим, в котором программе доступна лишь часть команд ЦП, и программы пользователя не смогут обратиться к некоторым функциям напрямую.

Обычно в привилегированном режиме работает ОС. Она же является посредником между программами и устройствами. То есть программа формирует запрос, где параметрами служат конкретные описания того, что следует сделать. В частности, обращение к внешним устройствам проходит по данной схеме — через обращение к ОС.

Таким образом, вывод на печать является не прямым обращением к устройству печати, а является обращением к ОС с заказом напечатать некоторую строчку. ОС принимает заказ и строку и буферизует информацию в некоторых своих программных буферах. То есть все, что мы пожелаем напечатать, будет аккумулировано в буферах ОС. Распечатка этого буфера будет происходить только когда будет ясно, что заказов на печать от конкретной задачи больше не поступит. То есть печать производится последовательно. Это еще один элемент связи между аппаратным и программным обеспечением.

Третья проблема. Имеется мультипрограммный режим. И в одной из программ появилась ошибка — программа зациклилась. Система повисла, ни одна программа не может работать. Что в этом случае может помочь? Помощь может оказать некоторое средство, которое будет переодически прерывать выполнение программ. Как минимум, это должно быть прерывание по таймеру — чтобы раз в некоторый диапазон времени управление передавалось в ОС. А далее уже должна реагировать сама ОС. А вот наличие такого прерывание и есть третье необходимое условие организации мультипрограммного режима.

Вообще при наличии прерывания по таймеру можно вообще отказаться от наличия асинхронной системы прерываний.

Итак, мы перечислили три условия на аппаратуру вычислительной системы, которые должны быть выполнены для организации мультипрограммного режима работы.

ОС

1ая программа

2ая программа

...

Nая программа

Следующая проблема — в системе, которая работает в МП режиме, находится много программ, обрабатываемых ЦП. Может возникнуть ситуация (сходная с проблемой виртуальной памяти). Существует некоторая физическая память, пусть она будет страничная. Если работает режим мультипрограммирования, то какую-то часть памяти занимает ОС, какую-то часть занимает первая программа, вторая и т.д. В простейшем случае в системе может находиться и обрабатываться столько программ,сколько позволит разместить в себе оперативная память. Но это достаточно неэффективно, потому что все равно выполнение программы локализовано в нескольких виртуальных страницах, и выполнение перемещается не так быстро, то есть могут быть, организованы какие-то циклы в пределах одной страницы, обращение к небольшим функциям и т.д. Это означает, что если мы будем размещать в ОЗУ весь код и данные, то большая часть ОЗУ будет простаивать. Поэтому имеется естественное желание в ОЗУ держать только те фрагменты кода и данных, которые в настоящий момент используются. А для этого используется аппарат подкачки (swapping). Это аппаратно-программное средство, суть которого заключается в следующем — в таблице приписки виртуальной памяти, в каждой строке может быть еще одно поле — поле, которое характеризует частоту обращения к странице. Это поле аппаратно формируется. То есть также, примерно, как собирается информация о “старении” информации в буфере ОЗУ, собирается информация об обращениях к данной странице в виртуальной памяти. По этим данным ОС может откачивать страницы, принадлежащие какому-либо процессу во внешнюю память. Например, после загрузки и некоторого времени выполнения программы, ОС начинает те страницы, к которым количество обращений было минимальным, сбрасывать на внешний носитель (на больших машинах обычно для этого используются магнитные барабаны). При этом, если страница откачена, то в таблицу приписки записывается отрицательное значение, и при возникновении обращения к этой строке (и, соответственно, возникновении прерывания) ОС сначала смотрит — а не есть ли это обращение к своей памяти, но которая откачена. Если это есть такое обращение, то ОС устанавливает заказ на подкачку этой страницы обратно, а пока это происходит, программа ожидает подхода информации, и в это время выполняются какие-то другие программы.

Такой механизм подкачки достаточно эффективен, он позволяет в ОЗУ от каждой из выполняемых программ держать незначительную часть. А когда в обработке находится большое число программ, то всегда при подкачке одной программы может выполняться другая.

С одной стороны подкачка поддерживается аппаратурой (подсчет “активности” страниц памяти сложно организовать программно), с другой стороны — все реальное управление программно.

Вот то, о чем можно сказать, рассматривая взаимодействие аппаратных и программных средств.

Теперь, если мы вернемся к нашей пирамиде

       

Прикладные программы

       
     

Системы программирования

     
   

Управление логическими устройствами

   
 

Управление физическими устройствами

 

Аппаратные средства

то мы видим, что все, о чем говорилось в предыдущих и этой лекции — взаимосвязано. То есть нельзя сказать, что в системе есть мультипрограммный режим, если нет аппаратной поддержки этого режима. И наоборот — при наличии аппаратных средств и отсутствии программ, использующих эти средства, вряд ли можно будет чего-либо добиться.

Это относится почти ко всему, за исключением, наверное, буферизации памяти между ОЗУ и ЦП — это практически полностью аппаратное средство.

Одна из наших целей — это пытаться видеть подобное взаимодействие между различного рода компонентами системы.

Вторая же проблема, которую мы всегда видели — это буферизация и сглаживание различных скоростей работы различных компонент. Мы говорили о сглаживании ОЗУ-ЦП и ВЗУ-ОЗУ.

Это, пожалуй, все, что относится к первой теме.

 

Лекция 5

 

Операционная Система (ОС)

Мы начинаем блок тем, называемых “Операционная система.”

Назначение и основные функции ОС

В принципе каждый из вас на сегодняшний день имеет некоторое представление об операционных системах. Но реально под ОС мы будем понимать комплекс программ, функциями которого является контроль за использованием и распределением ресурсов вычислительной системы. Мы с вами говорили о том, что в вычислительной системе есть физические ресурсы, то есть ресурсы, так или иначе связанные с реальным оборудованием, которое существует на самом деле — магнитные диски, оперативная память и прочее. Мы говорили о том, что в системе существуют логические ресурсы, то есть ресурсы, которые не имеют физического воплощения, но они существуют в виде некоторых средств, представляемых пользователю.

Все это мы будем называть ресурсами вычислительной системы.

Любая ОС оперирует некоторыми сущностями, которые во многом характеризуют свойства ОС. К таким сущностям могут относиться понятия файла, процесса, объекта и т.д. Конкретно, каждая ОС имеет свой набор этих сущностей, к примеру, если мы возьмем ОС WinNT, то к таким сущностям можно отнести понятие объекта ОС, и уже через это понятие, через управление этими ресурсами, предоставляются все возможные сервисные функции ОС. Если мы посмотрим на ОС Unix, то там такой сущностью является в первую очередь понятие файла, во вторую очередь — понятие процесса. И, возвращаясь, к последнему, процесс — это некоторая сущность (мы не говорим “объект” дабы не было путаницы с ООП), которая присутствует практически во всех ОС. Давайте попробуем определить понятие процесса, как одного из фундаментальных.

Итак, процесс — это программа, имеющая права собственности на ресурсы.

Рассмотрим две программы (код-данные) и рассмотрим все те ресурсы, которые принадлежат программе (пространство ОЗУ, данные на ВЗУ, права владения линией связи и т.п.). И если у двух программ множества ресурсов, принадлежащих им, совпадают, то в этом случае мы не можем говорить, что эти две программы образуют два процесса. Это один процесс.

Если же у каждой программы есть свое множество ресурсов, причем эти множества могут пересекаться (но не совпадать!), то мы говорим о двух процессах. Соответственно, в том случае, если множества ресурсов двух или нескольких процессов имеют непустое пересечение, то возникает проблема использования разделяемых ресурсов. Частично об этом было сказано на прошлой, когда приводился пример об одновременном использовании устройства печати двумя пользователями. У нас может быть масса процессов, каждый из которых имеет устройство печати одним из своих ресурсов. Раньше мы смотрели на этот пример с одной стороны, сейчас же мы смотрим на него с точки зрения синхронизации взаимодействия различных процессов. И эта синхронизация на примере устройства печати иллюстрировала нам одну из функций ОС, заключающуюся в управлении функционирования процессов.

Давайте посмотрим, что понимается под “управлением процессами”. Это достаточно просто:

1. Управление использованием времени ЦП. Планирование ЦП.

В какой момент времени, какая из задач будет использовать время ЦП.

    1. Управление подкачкой и буфером ввода процесса.

Предположим, что запущено множество процессов, в результате в системе образовалась масса задач, превышающая возможности обработки вычислительной системы. В этом случае образуется буфер, в котором процессы ожидают начало своей обработки. Возникает проблема очередности выбора из этого буфера процессов или задач.

При выполнении нескольких процессов может возникнуть необходимость освободить пространство в памяти для помещения туда кода или данных какой-либо задачи. В этом случае возникает проблема откачки на внешний носитель части других процессов. Возникает проблема — покакому алгоритму их откачивать? Чтобы процесс откачки был наиболее эффективным.

3. Управление разделяемыми ресурсами.

Когда у разных процессов имеется непустое пересечение ресурсов. То есть имеется набор ресурсов, доступ к которым в произвольный момент времени, организуется со сторон различных процессов (это та самая коллизия с устройством печати). И одной из реально сложных функций, которые определяют свойства ОС, это есть функция, обеспечивающая организацию взаимодействия процессов и использования общих ресурсов. Но помимо тривиальных вещей (устройство печати, МД и др.), доступ к которым разделяет почти любая ОС, существуют более сложные проблемы — например, когда два процесса имеют общую оперативную память. И управление таким разделяемым ресурсом — проблема.

 

 

Теперь давайте посмотрим на структуру ОС. Практически любая ОС имеет понятие ядра, ядра операционной системы. Ядром обычно является резидентная часть ОС (то есть та часть, которая не участвует в свопинге), работающая специализированном режиме (том самом, о котором говорилось в прошлой лекции). В функции ядра входит базовые средства управления основными сущностями ОС, обработка прерываний, а также может входить набор программ, обеспечивающих управление некоторыми физическими устройствами. (Мы иногда будем называть программы, управляющие физическими устройствами — драйверами устройств). Например, в ядро ОС может и должен входить драйвер ОЗУ. Далее вокруг ядра наращиваются программы управления ресурсами вычислительной системы. Первый уровень в основном состоит из программ управления физическими устройствами или драйверов физических устройств. Следующий уровень — это управление логическими устройствами. И так далее — таких уровней может быть достаточно много. Просто, чем дальше от ядра, тем большая абстрактность имеет место. У нас где-то могут появиться драйверы управления файлами, а на самом деле они связаны с драйверами управления логическими дисками, а те в свою очередь — с драйверами физических дисков.

Следует отметить следующий факт — что вовсе необязательно все компоненты ОС работают в режиме супервизора (в режиме операционной системы). Это первый тезис. Второе — вовсе необязательно все части ОС расположены резидентно в ОЗУ. Наоборот, многие из функций ОС реализуются в режимепользовательской программы. Для них режима супервизора не требуется.

Давайте теперь перейдем к более подробному рассмотрению основных функций ОС.

1. Управление использованием времени ЦП.

На самом деле от того, какой алгоритм выбора очередной задачи, для передачи ей активности ЦП, определен, зависят многие реальные эксплуатационные свойства ОС. А выбор алгоритма почти целиком и полностью определяется теми критериями эффективности, которые используются для оценки эффективности работы ОС. И поэтому управление ЦП мы рассмотрим на фоне типов ОС.

Первая ситуация: у нас есть большое число задач, требующих большого объема вычислительных мощностей системы. И эти задачи должны выполняться в одной вычислительной системе. Что будет являться критерием эффективности при работе системы для выполнения данных задач. Какой набор параметров можно взять и сказать, что если они маленькие — то хорошо, или если они большие, то хорошо или наоборот. Для такой ситуации критерием эффективности является степень загрузки ЦП. Если ЦП простаивает мало (либо ОС сама загружает процессор), то есть если потерянное время маленькое, то такая система работает хорошо и эффективно. Как добиться такой работы? С помощью хорошего алгоритма планирования. Мы запускаем для обработки тот набор задач, который у нас есть. То есть в системе работает режим мультипрограммирования. Алгоритм передачи ЦП от одного процесса к другому будет следующий — если ЦП выделен одному из процессов, то он будет владеть ЦП до одного из следующих моментов:

    1. обращение к внешнему устройству
    2. завершение процесса
    3. зафиксированный факт зацикливания процесса

Как только наступило одно из перечисленных событий — ЦП передается следующему процессу. Количество таких передач минимизировано и, соответственно, так как при передаче с одного процесса на другой ОС должна совершить ряд действий (загрузка таблиц приписки и прочее). Здесь эти потери минимизированы. Такой режим работы ОС называется пакетным. А сама ОС — пакетной.

Теперь рассмотрим следующий пример. Несколько человек сидят за терминалами и работают в текстовых редакторах. ОС — пакетная. Тогда, если один человек не будет нажимать клавиш, то время ЦП будет “висеть” у него (обмен не выполняется, не зациклен и не завершен), а другие пользователи будут обязаны ждать. То есть общая производительность системы несоизмеримо падает. Это означает, что алгоритм, который хорош для пакетной системы, здесь неприменим. Поэтому для задач, связанных с подобными режимами работы нужен другой алгоритм разделения времени. Какой? Что будет являтьсяпризнаком того — хорошо система работает или плохо? В качестве критерия эффективности в данной ситуации может использоваться время ожидания реакции на какое-либо событие (нажатия на клавишу и соответственной реакцией на это текстового процессора, например). Чем эффективнее работает система, тем среднестатистическое время ожидания — меньше.

Рассмотрим прежнюю ситуацию, когда в обработке находится сразу несколько процессов. И наша задача распределить время ЦП таким образом, чтобы время реакции системы на запрос пользователя было минимальным, либо хотя бы гарантированным. И вот следующая схема: в системе используется некоторый параметр (dt), который называется квантом времени. В общем случае квант времени это есть некоторое значение, которое может меняться при настройке системы. Далее, все множество процессов, которое находится в мультипрограммной обработке, делится на два подмножества.

Первое подмножество — это те процессы, которые еще не готовы к продолжению выполнения (ожидающие обмена, подкачки и т.п.).

Второе — которые готовы к выполнению. В этом случае работа будет осуществляться по правилу: тот процесс, который владеет ЦП, будет выполняться до тех пор, пока не наступит одно из трех событий:

    1. запрос на обмен
    2. завершение процесса
    3. исчерпание выделенного процессу кванта времени

При наступлении одного из этих событий планировщик ОС выбирает из процессов один, готовый к выполнению, и передает ему ресурсы ЦП. Как выбирает? Это уже некоторые нюансы реализации алгоритма планирования. Процесс может выбираться произвольно, последовательно, по времени, которое данный процесс не владел ЦП (ОС может выбирать тот, у которого это время наибольшее).

Все эти алгоритмы реализуются в ОС и все они должны быть максимально простыми, дабы система не загружалась на их выполнение.

ОС с перечисленными выше свойствами называются ОС разделения времени.

У пользователя такой ОС должна создаться иллюзия, что все ресурсы системы предоставлены только ему.

Давайте рассмотрим следующее. Предположим, у нас есть самолет, который идет на снижение. Вы, наверное, знаете, что у самолета имеется прибор, который меряет высоту от поверхности земли до самолета. Самолет находится в режиме автопилота. Во время снижения автопилот с помощью указанного прибора отслеживает высоту. Но помимо этой задачи, он выполняет еще контроль за двигателями, остатком топлива, герметизацией и т.д. Для каждого из этих действий выделен отдельный процесс. Предположим, у нас имеется пакетная система. Мы внимательно контролируем в данный момент содержимое топливных баков... Как-то не складывается... А предположим, у нас система разделения времени. Одним из качеств такой системы является ее неэффективность, так как время ЦП расходуется на большое количество переключений между процессами — а это функция достаточно трудоемкая. Получаем в результате, что у нас высота уже подходит к нулю, а ОС занимается восстановлением таблиц приписки... Нехорошо получается... То есть для анализа каких-то ситуаций в один случаях наше dt годится, а в других — нет.

То есть для подобных задач нужны свои средства планирования. И в этих случаях используются так называемые ОС реального времени, основным критерием которых является время гарантированной реакции системы на возникновение того или иного события из набора заранее предопределенных события. То есть в системе есть события, которые будут обработаны в любой ситуации за некоторое наперед заданное время. Для нашего примера такими событиями могут быть показания прибора высоты, работы двигателей и т.д.

Реально для ОС этого класса используются достаточно простые алгоритмы планирования.

Подводя некоторую черту под этой первой функцией управления временем ЦП, следует обратить внимание на два факта:

Это все, что касается первой функции.

 

2. Управление подкачкой и буфером ввода.

Здесь алгоритмы планирования также нужны, но они не столь критичны. В общем-то в реальных системах совмещается буфер подкачки и буфер ввода процесса. Это первое замечание. Второе замечание. Современные ОС достаточно “ленивые” и откачку они зачастую осуществляют не блоками памяти, а целыми процессами. Здесь возникает два вопроса — критерий замещения процесса в ЦП и критерий выбора процесса из буфера для обработки. Самый простейший вариант заключается в использовании времени нахождения в том или ином состоянии. То есть в первом, если мы решаем вопрос об откачке процесса из активного состояния в область подкачки, то мы можем взять тот процесс, который дольше всего находится в состоянии обработки. Обратный процесс может быть также симметричен. То есть из области подкачки мы можем брать тот процесс, который дольше всего находится на буфере ввода.

На самом деле это очень простые алгоритмы, и они могут видоизменяться из соображений различных критериев в той или иной ОС. Один из критериев — все задачи могут быть подразделены на несколько категорий (например, задачи ОС могут всегда выполняться в первую очередь).

 

3. Управление разделяемыми ресурсами.

И в двух словах о третьей функции — об управлении разделяемыми ресурсами. Здесь будет обозначена только проблема, ибо решения мы с вами будем рассматривать уже конкретно на примере ОС Unix. Предположим имеется два процесса, которые работают на общее пространство ОЗУ. У каждого процесса есть область ОЗУ, которая одновременно принадлежит и другому процессу. Здесь имеется целый букет проблем. При этом разделяемые ресурсы могут работать в разных режимах. Например, два процесса могут работать на разных машинах, но при этом могут быть связаны общим полем ОЗУ. В этом случае возникает проблема с буферизацией с работой памяти, так как на каждой из машин есть свои механизмы буферизации. И может возникнуть ситуация, когда состояние физической памяти не соответствует реальному ее содержимому. И возникают проблемы работы такой системы. Следующая проблема — два процесса работают на одной машине, проблем с буферизацией нет, но должны быть какие-то средства синхронизации разделяемой памяти, иначе такая организация бессмысленна, то есть позволят создать условия, при которых обмен каждого из работающих процессов с разделяемой памятью будет проходить корректно, а это означает то, что при каждом чтении информации из разделяемой памяти должно быть гарантировано то, что все те, кто хотел что-то прочитать или записать и начал это делать, уже этот процесс завершили, то есть должна быть синхронизация по обмену с разделяемой памятью.

Реально зачастую не требуется при решении задач таких разделяемых ресурсов, как общая память. Но хотелось бы, чтобы процессы, которые функционируют одновременно могли оказывать влияние друг на друга, аналогичное аппарату прерываний. Для реализации этого во многих ОС имеется средство передачи между процессами сигналов, то есть возникаетнекоторая программная эмуляция прерывания. Один процесс передает сигнал другому процессу, и в другом процессе происходит прерывание и передача управления на некоторую предопределенную функцию, которая должна обработать этот сигнал.

Было обращено внимание на те функции, которые влияют на эксплуатационные функции ОС. Реально же функций у ОС гораздо больше.

Лекция 6

На прошлой лекции мы с вами начали рассматривать определения, состав, основные функции ОС. Мы определили, что ОС это комплекс программ, обеспечивающих контроль за распределением и использованием ресурсов вычислительной системы, что практически каждая ОС оперирует некоторым набором базовых сущностей. И одной из главных таких сущностей является процесс.

Было определено, что процесс, это есть нечто, обладающее ресурсами вычислительной системы. И мы приводили примеры процессов, которые могут иметь определенный набор ресурсов системы, возможно, с некоторыми пересечениями. Соответственно, мы определили, что процесс и программа это не одно и то же. Программа может состоять из нескольких процессов.

В общем случае, в рамках одного процесса может быть реализовано несколько программ. Мы еще будем говорить об этом, а сейчас главное понять, что процесс и программа — это две большие разницы.

Мы говорили о том, что одной из проблем ОС является проблема распределения времени ЦП между конкурирующими за это время процессами. При этом на концептуальном уровне были рассмотрены алгоритмы распределения времени между процессами и влияние этих алгоритмов на реальные эксплуатационные характеристики ОС.

Мы рассмотрели, что есть пакетная ОС и какие алгоритмы отдачи времени ЦП приемлемы для пакетной ОС, было сказано про ОС разделения времени.

В подавляющем большинстве случаем мы работаем в режиме разделения времени.

Предварительно мы говорили, что любая ОС реализует в себе буферизацию ввода/вывода. Буферизация в ОС — есть одна из основных функций. И по аналогии борьбы с разными скоростями доступа к различным компонентам вычислительной системы, ОС вводит в своих пределах программную буферизацию запросов на ввод/вывод, которая также решает проблемы сглаживания времени доступа, а также проблемы синхронизации в целом. Синхронизацию в целом можно пояснить примером с разделением устройства печати. А сглаживание доступа заключается в том, что практически каждая современная ОС имеет кэш-буфера, которые аккумулируют обращения к ВЗУ. То есть суть такова, что также как и при работе ОЗУ, реальные обмены могут не происходить, этот механизм организован похоже, за тем исключением, что реализован он программно, в отличие от аппаратной реализации буферизации ОЗУ. Это позволяет существенно оптимизировать ОС. Признаком наличия такой буферизации является требование прекратить выполнение ОС перед завершением работы вычислительной системы (например, MS DOS такого требования не предъявляет — компьютер под его управлением можно включать и выключать в любое время без потерь, а в таких системах, как Unix, Win95 и других, подобное выключение машины может привести к потере информации, так как в момент выключения часть данных может находиться еще в буфере.) Степень этой буферизации определяет реальную эффективность системы.

Приведем пример. Если поменять процессор 486 на Pentium в системе, где работает Win95, то быстродействие системы увеличится ненамного. Это означает, что быстродействие системы упирается в работу с внешними устройствами, механизм буферизации неэффективен — реальных обменов с внешними устройствами остается также много. В то время как ОС Unix, при такой же замене ЦП, дает качественный скачок вперед по быстродействию, так как в этой ОС, буферизация организована значительно лучше.

Мы с вами говорили сегодня и в прошлый раз о том, что каждая ОС оперирует с некоторыми сущностями, и одна из них — это процесс. Есть и вторая сущность, которая также важна, и во многих ОС она занимает главенствующую роль. Эта сущность — понятие файла.

Файловая система — это компонент ОС, обеспечивающий организацию создания, хранения и доступа к именованным наборам данных. Эти именованные наборы данных называются файлами.

 

Свойства файлов

 

    1. Файл — это некий объект, имеющий имя и позволяющий оперировать с содержим файла, через ссылку на это имя. Обычно имя — это последовательность букв, цифр и разделителей длины, которая зависит от конкретной ОС.
    2. Файл независим от расположения. Для работы с файлом не требуется информация о месторасположении данных на ВЗУ.
    3. Защита файлов. На самом деле многие стратегические решения повторяются как на аппаратном уровне, так и на уровне ОС. Если мы вспомним мультипрограммный режим, то одной из проблем была возможность защиты памяти. Файловая система может также, как и ОС быть однопользовательской, либо многопользовательской. Во втором случае мы имеем ситуацию, когда возможно обеспечить корректную работу нескольких пользователей (аналогично мультипрограммному режиму). Примером некорректной работы могут служить MS DOS, MS Windows — при ошибке в одном процессе могут быть испорчены и сама ОС и соседние процессы. Корректная работа означает, что при организации многопользовательской системы никто не может испортить чужой процесс или файл. Многопользовательская файловая система означает защиту от несанкционированного доступа к информации файлов. Одним из атрибутов файловых систем является атрибут защиты. Вообще, реальная ОС должна обеспечивать защиту не только файлов, но и всех ресурсов, принадлежащих процессам, запущенным от имени одного пользователя.

Практически каждая ОС обеспечивает набор функций ввода/вывода для работы с файлами.

Обычно этот набор состоит из следующих функций:

Указатель: Файл:

 

Блок 0

->

Блок 1

 

...

 

Блок N-1

После каждого обмена указатель показывает на следующий блок (относительный адрес по файлу), с которым можно произвести обмен. Это означает, что если в какой-то момент мы из какой-то позиции читаем блок данных, то указатель переносится на следующий блок. То же самое происходит и при записи.

Указатель, это некоторая переменная, доступная для программы. Она создается в момент открытия файла.

 

Структура файловой системы

Давайте рассмотрим некоторое пространство ВЗУ и рассмотрим, как мы можем организовать файлов в пределах этого пространств.

Одноуровневая организация файлов непрерывными сегментами.

Ее суть такова — в пределах пространства ВЗУ выделяется некоторая область для хранения данных, которая называется “Каталог”. Каталог имеет следующую структуру

Каталог

Имя

начальный блок

конечный блок

...

...

...

...

...

...

Имя — имя некоторого файла

Начальный блок — относительный адрес блока, с которого начинается файл.

Конечный блок — относительный адрес последнего блока файла.

Соответственно, функция открытия файла сводится к тому, чтобы в этой таблице “Каталог” найти по имени нужный файл и определить начало его размещения и конец размещения. Действие очень простое, так как дополнительных обменов не требуется — весь каталог можно хранить в памяти ОС. Если создается новый файл, то он записывается на свободное место. Альтернативно каталогу имен существует таблица свободных фрагментов пространства ВЗУ.

С открытием файла все просто — по имени сразу получается диапазон размещения файла, причем реально данные могут занимать меньше места, чем диапазон начала-конца.

Чтение-запись происходят практически без дополнительных обменов, так как для получения координат файла на носители не требуется совершать лишних действий.

Но что будет, когда требуется записать в такой файл дополнительную информацию, а свободного пространства за файлом нет? В этом случае файловая система может поступить двояко: в первом случае — она скажет, что места нет, и пользователь должен что-то сделать сам (например, перенести файл на большее место, где хватит места для того, чтобы дописать информацию в файл — но такой перенос дело очень дорогостоящее), во втором случае — будет просто отказано в обмене, то есть при открытии файла мы должны были сразу зарезервировать необходимое место.

Итак, организация простая, при обменах — эффективная, но в случае нехватки пространства для файлов начинается неэффективность и при долговременной работе случается фрагментация (когда имеются свободные фрагменты, которые объемом позволяют разместить файл, а расположением — нет). Это та же самая проблема, которая имела место в ОЗУ. Решить данную проблему можно путем компрессии — долгого и опасного для данных процесса, который передвигает блоки по ВЗУ с целью разместить их оптимальным образом. Можно сделать эту компрессию так, чтобы в конец каждого файла был добавлен кусок свободного места (например, по 10% от текущей длины).

Такая файловая система может быть пригодна только для однопользовательской системы. Ибо при большом потоке информации, в случае многопользовательской системы, происходит быстрая деградация файлового пространства и требуется долговременный процесс компрессии. Она одноуровневая — то есть не может быть двух файлов с одинаковыми именами. Но она очень проста и требует минимум дополнительных расходов.

Файловая система с блочной организацией файлов.

0

 

1

 

2

 
   

N-1

 

Пространство ВЗУ разделено на блоки (блоки удобных для обмена размеров или кратных им). В файловой системе такого типа происходит аналогично распределению процесса в памяти со страничной организацией. То есть в общем случае с каждым именем файла связан набор номеров блоков устройства, в которых размещены данные этого файла,

Name {Блок1, Блок2, ..., БлокM}

причем эти блоки имеют произвольный порядок на ВЗУ:

ВЗУ:

...

БлокМ

Блок4

пустой блок или блок другого файла

Блок1

...

При такой организации мы имеем потери кратные блоку (если хотя бы один байт блока занят, то он считается непустым и не может быть отдан другому файлу), но при такой схеме нет проблемы фрагментации. Как следствие, нет надобности в компрессии. Следовательно, такая файловая система может использоваться при многопользовательской работе.

В последнем случае с каждым файлом у нас связано несколько атрибутов:

Имя файла

Имя пользователя

И, соответственно, доступ к файлу осуществляется заданием двух параметров. Таким образом, уже необязательна уникальность имен файлов во всей файловой системе, нужна лишь уникальность имен файлов у одного пользователя. У разных пользователей могут быть файлы с одинаковыми именами.

Организация таких файлов может быть через каталог. Структура каталога может быть следующая:

   

i->

блок занят или свободен, если занят, то кем.

   
   
   

Каталог содержит строки, каждая iая строка соответствует iому блоку файловой системы, в этой строке содержится информация о занятости блока. Если он занят, то в этой строке указывается имя файла (или ссылка на него) и имя пользователя, может быть и какая-то дополнительная информация.

При открытии файла система может, например, пробегать по ВЗУ и строить таблицу соответствия между логическими блоками файла и физическими (блоками носителя).

При данной организации файловой системы мы имеем одноуровневую структуру пользователей и, как следствие, все файлы связаны в группы только по принадлежности какому-либо пользователю.

Иерархическая файловая система.

Все файлы файловой структуры строятся в дерево. Корнем дерева является так называемый корень файловой системы. Если узел дерева является листом, то это файл, который может содержать либо данные, либо являться каталогом. Узлы, отличные от листьев являются каталогами. Соответственно, именование в такой системе может происходить разными способами. Первый — именование фала относительно ближайшего каталога. Если мы посмотрим файлы, которые являются ближайшими для каталога F0 — это файл F1 (он тоже является каталогом) и файл F2. То есть если мы каким-то образом подразумеваем (системным образом), что работаем в каталоге F0, то можем обращаться к файлам в данном каталоге только по их именам (F1 и F2). Соответственно, на одном уровне имена должны быть уникальны (в пределах одного каталога). Так как мы имеем структуру дерева, то можно говорить о полном имени файла, которое составляет путь от корня дерева, до файла. Например, путь к файлу F3 будет выглядеть, как “/F0/F1/F3”. В одно и то же время мы можем работать как с полным, так и с коротким именем файла. А так как по свойству дерева путь к каждому листу однозначен, то мы сразу решаем проблему унификации имен.

Первой такая организация появилась в ОС Multics, которая разрабатывалась в университете Беркли в конце 60х годов. Это было давно, но такое хорошее и красивое решение с тех пор стало появляться во многих ОС.

Соответственно с иерархией каждому файлу можно привязывать некоторые атрибуты, связанные с правами доступа, этими атрибутами могут обладать как файлы, так и каталоги. То есть структурная организация такой файловой системы хороша для многопользовательской системы. Ибо с одной стороны нет проблемы именования, а с другой стороны такая система может сильно и хорошо наращиваться.

 

Защита данных в ОС

Идентификация — возможность ОС распознать определенного пользователя и выполнять в зависимости от определения нужные действия по защите данных и т.п. Например, MS DOS — однопользовательская ОС. Существуют системы, которые позволяют регистрировать пользователей, но эти пользователи никак между собой не связаны (примером могут являться некоторые ОС фирмы IBM для мейнфреймов), а значит их нельзя организовать в группы. Но было бы удобно выделить в отдельную группу — лабораторию, кафедру, учебную группу студентов и т.п.

В иерархической организации пользователей есть понятие группы. А в группе есть реальные пользователи.

При регистрации конкретного пользователя его следует отнести к какой-либо группе.

Раз пользователи разделены на группе, то по аналогии с разделением между конкретными пользователями, можно разделять ресурсы с группой (то есть пользователь может сделать свои файлы доступными для всех членов какой-то группы.

И такое деление на группы может быть также многоуровневым с соответствующим распределением прав и возможностей.

Маленькое замечание — сейчас появляются ОС, в которых права доступа могут быть не только иерархическими, но и более сложные — например, нарушая иерархию (какой-то файл может быть доступным конкретному пользователю из группы другой ветви дерева).

 

Вот, наверное, и все, что следовало бы сказать о свойствах и функциях ОС. Естественно, мы рассмотрели далеко не все функции ОС. Что-то было специально упущено, так как мы рассматриваем ОС в упрощенной модели. Ибо наша цель — не изучение конкретной ОС, а научиться классифицировать ОС, с каких точек зрения следует на нее смотреть и сравнивать различные типы ОС.


[Наверх: в начало разделаНазад: некудаВперед: Лекции 7-9Здесь: Лекции 4-6]