CFA LogoCFA Logo Computer
Новости Статьи Магазин Драйвера Контакты
Новости
RSS канал новостей
В конце марта компания ASRock анонсировала фирменную линейку графических ускорителей Phantom Gaming. ...
Компания Huawei продолжает заниматься расширением фирменной линейки смартфонов Y Series. Очередное ...
Компания Antec в своем очередном пресс-релизе анонсировала поставки фирменной серии блоков питания ...
Компания Thermalright отчиталась о готовности нового высокопроизводительного процессорного кулера ...
Компания Biostar сообщает в официальном пресс-релизе о готовности флагманской материнской платы ...
Самое интересное
Программаторы 25 SPI FLASH Адаптеры Optibay HDD Caddy Драйвера nVidia GeForce Драйвера AMD Radeon HD Игры на DVD Сравнение видеокарт Сравнение процессоров

АРХИВ СТАТЕЙ ЖУРНАЛА «МОЙ КОМПЬЮТЕР» ЗА 2002 ГОД

Занимательная статистика

Владимир СИРОТА vovsir@km.ru

Недавно, проезжая в трамвае, услышал разговор трех студенток. Суть его сводилась примерно к следующему: зачем, мол, нам, красавицам, эта статистика. А между прочим, статистика — это очень интересная штука...

Наверное, многие из вас представляют себе статистику как скучный процесс сбора информации, которая впоследствии путем сводки, группировки и простейшего анализа предстает в виде таблиц и индексов, графиков и диаграмм. Но это далеко не так. Ведь статистика — это целая наука, родословная которой уходит корнями в глубокую древность. Свое нынешнее название она получила от латинского слова «status» — состояние. То есть, как вы поняли, это наука, дающая наиболее полное представление о состоянии дел. Каких? В общем, каких угодно и где угодно. А главное — статистика достаточно гибка в своих подходах к анализу тех самых явлений и процессов, которые она изучает. Не потому ли появилось утверждение, что статистика имеет три уровня по иерархии достоверности: ложь, откровенная ложь и наглая ложь :-)?

Поскольку наши дела — компьютерные, углубимся в сферу именно наших интересов, и попробуем проследить на примерах простейших приемов статистического анализа, как обманчива магия цифр, которыми так пестрят издания нашего толка. Не вдаваясь в дополнительное словоблудие, скажу, что в нашем случае чаще всего оперируют количественными данными. И лишь изредка, преимущественно в рейтинговых оценках, могут учитывать качественные показатели. Но их мы благоразумно трогать не будем :-).

Итак, предметом наших интересов будут абсолютные и относительные величины, а также средние величины (те же всеми любимые fps’ы), которые можно извлечь из ПК. Рассматривая специфику элементарного анализа каждой из этих величин, мы увидим, насколько интересными и познавательными могут быть полученные результаты. Узнаем, как, соблюдая строгую научность подхода, можно сделать совершенно разные выводы на основе одних и тех же данных :-). А также научимся не поддаваться соблазну поверхностного анализа.

Чтобы нагляднее представить, насколько широкий простор для творчества дает даже простейший статистический анализ, рассмотрим ряд любопытных примеров.

Начнем со средних величин. Вот, выбирая меж двух «горячих» видеокарт, пользователь находит две статьи о них. И начинает сравнивать, например, те же средние fps’ы в игрушках, чтобы определиться с выбором. Однако такое сравнение некорректно. Дело в том, что платформы, на которых тестировались устройства, сами по себе наверняка имели разную системную производительность, то есть полученные из разных источников результаты замеров попросту несопоставимы. Посему всегда помните один из пяти постулатов статистического анализа: необходимо соблюсти условие сравнимости данных. Даже анализируя производительность на одной и той же платформе, необходимо четко соблюдать принцип одинаковых параметров работы приложений (например, того же уровня детализации в играх), иначе полученные результаты будут просто некорректны. Увы, об этом частенько забывают. Вот и выходит, что средняя средней — рознь.

С абсолютными величинами тоже не все так просто — зачастую по такой количественной оценке ориентироваться нельзя. Вот знакомый вам говорит: эта карта у меня стабильно давала на 10 кадров в любом разрешении больше, чем та, поэтому бери себе только эту. Но что значит эта разница в 10 fps и можно ли на ее основании делать какие-либо окончательные выводы? Совершенно очевидно, что нет. Даже если результат получен на одной и той же системе. «Но как же, первая карточка всегда быстрее, поэтому она то что надо, а вторая — отстой», — воскликнут горячие головы. Не торопитесь с выводами. Да, первая карта выдает на 10 fps’ов больше, чем вторая. Но мы ведь не узнали общую картину — а сколько всего кадров в секунду продемонстрировали карты? Если одна выдала 25, а другая 15 fps — то действительно, вторая намного хуже первой, без вариантов. Но если первая показала 125 fps, а вторая 115? И если первая стоит 100 у.е., а вторая 50? Так какая из них лучше? По соотношению цена/производительность в первом случае получаем только 1.25 fps за у. е., а во втором — уже 2.3. То есть, совершенно очевидно, что вторая карточка — гораздо более выгодная покупка, нежели первая: общая разница в производительности между ними несущественна, а на сэкономленные деньги вы сможете себе купить половину автомобиля «Москвич» времен «Бриллиантовой руки» :-). Как видите, при анализе важен комплексный подход, и спешить с выводами, базируясь только на сведениях о каком-то видимом количественном превосходстве, по меньшей мере неразумно. Лучше всего выражать это превосходство в относительных величинах сравнения, например тех же процентах, что даст более объективную почву для оценки. К примеру, если мы скажем, что та карта быстрее этой на 10% в таком-то режиме, то совершено очевидно, что на каждые 10 кадров медленной карты мы будем получать в этом режиме 11 кадров на более быстрой. Но и с процентами не все так однозначно, как вы, возможно, подумали.

Взгляните на рис. 1. Что вы можете о нем сказать? Процессор Pentium 4 1.6 ГГц превосходит сравниваемый процессор (Celeron 900 МГц) на 77.7% по тактовой частоте и опережает его в целочисленных операциях на 26.2%. Да он просто милашка, скажут одни. А наш-то процессорчик отстает от Pentium 4 1.6 ГГц на Рис. 1целочисленных операциях всего на 20.7% по производительности, хотя его частота на 43.7% ниже, поэтому отстой ваш четвертый пень, скажут другие. Что же это? Кто же из них прав? Самое смешное, что правы... обе стороны. Как же так? А все очень просто. По крайней мере для тех, кто знает статистику. Все дело — в манипулировании базой сравнения. База сравнения — это то, с чем в данном конкретном случае происходит сравнение. Когда мы говорим, что Р4 превосходит Celeron, то за базу сравнения (100%) берем последний, так как «равняемся» по нему. Если же мы утверждаем, что Celeron отстает от Р4, то мы «равняемся» уже по последнему — именно «пень» послужит нам той самой базой сравнения, эталоном, принятым за 100%. Отсюда становится понятна и разница в результатах. Хотя в абсолютных показателях она всегда одинакова — 700 МГц и 637 MIPS (но мы ведь раньше показали, что по этой разнице окончательных выводов не «сваришь»), но из-за того, что количество мегагерц, умещающихся в 1% в обеих случаях разное, имеем и столь отличающиеся результаты. А выбираем тот, который больше понравится — ибо оба верны и строго научно обоснованны. Такая вот любопытная штука — Р4 опережает Celeron на 26%, а Celeron отстает от Р4 на 20%. И все точно, как в аптеке :-).

Приведенный выше простой пример в то же время показывает, как бережно надо относиться к статистическим показателям. Особенно это касается процентов и процентных пунктов, которые неподкованные в статистике господа начинают как ни попадя складывать/раскладывать, словно пасьянс. Ведь они бы наверняка заявили, что если Р4 опережает Celeron по вычислительной мощности на 26.2%, то и Celeron отстает, соответственно, от Р4 более чем на четверть. Хотя на самом деле такое отставание едва переваливает за одну пятую, то есть на добрых 6 процентных пунктов меньше (надеюсь, вы различаете проценты и процентные пункты :-)).

Вот так запросто, даже на расстояние светового года не приблизившись к теории относительности, мы пришли к выводу, что все в мире относительно :-). В зависимости от базы сравнения, то бишь точки зрения. Тут уж, чтобы разобраться, крайне желательно взглянуть на картинку с наглядным изображением рассчитанных показателей. Как говорится, лучше один раз увидеть, но… Здесь нас уже могут подстерегать мастера наглядной агитации.

Наиболее распространенным для обильного увешивания лапшей наивных пользовательских ушей является метод графического представления информации. Вот уж где простор для творчества, благо много ума для изменения меток на оси не надо. Воззрите на картину, изображенную на диаграмме 1. Здесь изображены показатели производительности Pentium III 1ГГц и Duron 800 МГц на операциях с плавающей запятой. Не правда ли, складывается впечатление что Р III более чем в три раза производительнее Duron’а? Но это впечатление обманчиво — взгляните на формат оси, отсчет ее минимального значения ведется с 1000, а не с нуля — вот в чем секрет феноменального успеха Pentium :-)! А реально Р III быстрее всего на 21,8%. И «честный» график — диаграмме 2 демонстрирует всю обманчивость первого впечатления.

Диаграмма 1   Диаграмма 2

Я привел вам лишь элементарные базовые приемы, позволяющие «склонять» результаты статистического анализа в ту или иную сторону. И в зависимости от того, что вы хотите подчеркнуть, достоинства или недостатки того или иного девайса, можно применять те или иные подходы при обработке данных. Вы запросто добьетесь желаемого, даже не перекручивая, не искажая данных. И это с помощью простейших приемов анализа. А для настоящих энтузиастов статистика открывает такое поле для творчества, что многим не снилось, не являлось под кайфом, не…

Рекомендуем ещё прочитать:






Данную страницу никто не комментировал. Вы можете стать первым.

Ваше имя:
Ваша почта:

RSS
Комментарий:
Введите символы или вычислите пример: *
captcha
Обновить





Хостинг на серверах в Украине, США и Германии. © sector.biz.ua 2006-2015 design by Vadim Popov