В окно выглядывать – покой, мир, безопасная ситуация.В него вылезать или из...
http://www.hi-edu.ru/e-books/xbook096/01/index.html?part-011.htm – очень полезный сайт!
Выборочный метод исследования является основным статистическим методом. Это естественно, так как объем изучаемых объектов как правило бесконечен (и даже, если конечен, то весьма затруднительно перебрать все объекты, приходится довольствоваться лишь их частью, выборкой).
Генеральной совокупностью называется совокупность всех исследуемых в данном эксперименте элементов.
Выборочной совокупностью (или выборкой) называется конечная совокупность объектов, случайно отобранных из генеральной совокупности.
Объемом совокупности (выборочной или генеральной) называется число объектов этой совокупности.
Допустим, исследуется психологическая предрасположенность человека к делению данного отрезка в отношении золотого сечения. Так как происхождение самого понятия золотого сечения продиктовано антропометрией человеческого тела, то понятно, что в данном случае генеральной совокупностью является любое антропогенное существо достигшее физической зрелости и приобретшее окончательные пропорции, то есть - вся взрослая часть человечества. Объем этой совокупности практически бесконечен.
Если же эта предрасположенность исследуется исключительно в художественной среде, то генеральная совокупность - это люди, имеющие непосредственное отношение к дизайну: художники, архитекторы, дизайнеры. Таких людей тоже очень много, и можно считать, что объем генеральной совокупности в данном случае тоже бесконечен.
И в том, и в другом случае для исследования мы вынуждены ограничиться разумными объемами выборок, выбирая в качестве представителей той и другой совокупностей студентов технических специальностей (как людей, далеких от художественного мира) или студентов специальности дизайн (как людей, имеющих непосредственное отношение к миру художественных образов).
Основной проблемой выборочного метода является вопрос о том, насколько точно объекты, отобранные из генеральной совокупности для исследования, представляют изучаемые характеристики генеральной совокупности, то есть - вопрос о репрезентативности выборки.
Итак, выборка называется репрезентативной (представительной), если она достаточно точно представляет количественные соотношения генеральной совокупности.
Разумеется, трудно сказать, что именно скрывается за расплывчатой формулировкой достаточно точно . Вопросы репрезентативности вообще являются наиболее спорными в любом экспериментальном исследовании. Имеется масса ставших уже классическими примеров, когда недостаточная представительность выборки приводила экспериментаторов к абсурдным результатам.
Как правило, вопросы репрезентативности решаются при помощи экспертной оценки, когда научное сообщество принимает точку зрения группы авторитетных специалистов по поводу корректности проведенного исследования.
Вернемся к примеру с делением отрезка. Вопросы репрезентативности выборок лежат здесь в самой основе исследования: мы ни в коем случае не должны смешивать группы испытуемых по признаку принадлежности их к художественной среде.
Статистическое распределение наблюдаемого признака
Частота наблюдаемого значения
Пусть в результате испытания в выборке объема наблюдаемый признакпринял значения,, …, причем значениенаблюдалосьраз, значение-раз, и т. д., значениенаблюдалосьраз. Тогда частотой наблюдаемого значенияназывается число, значения- числои т. д.
Относительная частота наблюдаемого значения
Относительной частотой наблюдаемого значенияпризнаканазывается отношение частотык объемувыборки:
Понятно, что сумма частот наблюдаемого признака должна давать объем выборки
а сумма относительных частот должна давать единицу:
Эти соображения можно использовать для контроля при составлении статистических таблиц. Если равенства не соблюдаются, то при протоколировании результатов эксперимента была допущена ошибка.
Статистическое распределение наблюдаемого значения
Статистическим распределением наблюдаемого признака называется соответствие между наблюдаемыми значениями признака и отвечающими им частотами (или относительными частотами).
Как правило, статистическое распределение записывается в виде двухстрочной таблицы, в которой в первой строке указываются наблюдаемые значения признака, а во второй - соответствующие им частоты (или относительные частоты):
Распределение случайной величины содержит всю информацию о ее статистических свойствах. Много ли нужно знать значений случайной величины, чтобы построить ее распределение? Для этого нужно исследовать ее генеральную совокупность .
Генеральная совокупность - множество всех значений, которые может принимать данная случайная величина.
Число единиц в генеральной совокупности называется ее объемом N . Эта величина может быть конечной и бесконечной. Например, если исследуется рост жителей некоторого города, то объем генеральной совокупности будет равен числу жителей города. Если выполняется любой физический эксперимент, то объем генеральной совокупности будет бесконечным, т.к. число всех возможных значений любого физического параметра равно бесконечности.
Исследование генеральной совокупности не всегда возможно и целесообразно. Оно невозможно, если объем генеральной совокупности бесконечен. Но и при конечных объемах полное исследование не всегда оправдано, поскольку требует больших затрат времени и труда, а абсолютная точность результатов обычно не требуется. Менее точные результаты, но со значительно меньшими затратами сил и средств можно получить при исследовании только части генеральной совокупности. Такие исследования называются выборочными.
Статистические исследования, проводимые только на части генеральной совокупности, называются выборочными, а исследуемая часть генеральной совокупности называется выборкой.
На рисунке 7.2 символически показаны генеральная совокупность и выборка в виде множества и его подмножества.
Рисунок 7.2 Генеральная совокупность и выборка
Работая с некоторым подмножеством данной генеральной совокупности, часто составляющим незначительную ее часть, мы получаем результаты, по точности вполне удовлетворительные для практических целей. Исследование большей части генеральной совокупности только увеличивает точность, но не изменяет сути результатов, если выборка взята правильно со статистической точки зрения.
Для того, чтобы выборка отражала свойства генеральной совокупности и результаты были достоверными, она должна быть репрезентативной (представительной).
У некоторых генеральных совокупностей любая их часть является репрезентативной в силу их природы. Однако в большинстве случаев необходимо принимать специальные меры для обеспечения репрезентативности выборок.
Одним из главных достижений современной математической статистики считается разработка теории и практики метода случай ных выборок, обеспечивающих репрезентативность отбора данных.
Выборочные исследования всегда проигрывают в точности по сравнению с исследованием всей генеральной совокупности. Однако с этим можно примириться, если величина погрешности будет известной. Очевидно, что чем больше объем выборки будет приближаться к объему генеральной совокупности, тем погрешность будет меньшей. Отсюда ясно, что проблемы статистического вывода становятся особенно актуальными при работе с малыми выборками (N ? 10-50).
Исследование обычно начинается с некоторого предположения, требующего проверки с привлечением фактов. Это предположение - гипотеза - формулируется в отношении связи явлений или свойств в некоторой совокупности объектов. Для проверки подобных предположений на фактах необходимо измерить соответствующие свойства у их носителей. Но невозможно измерить, например, тревожность у всех подростков. Поэтому при проведений исследования ограничиваются лишь относительно небольшой группой представителей соответствующих совокупностей людей.
Генеральная совокупность - это все множество объектов, в отношении которого формулируется исследовательская гипотеза. Теоретически считается, что объем генеральной совокупности не ограничен. Практически же объем генеральной совокупности всегда ограничен и может быть различным в зависимости от предмета наблюдения и той задачи, которую предстоит решать психологу. Обычно генеральная совокупность включает в себя очень большое число объектов- студентов вуза, школьников, работников предприятия, пенсионеров и т.д. Сплошное исследование генеральных совокупностей чрезвычайно затруднительно, поэтому, как правило, изучается небольшая часть генеральной совокупности, называемая выборочной совокупностью, или выборкой.
Выборка - это ограниченная по численности группа объектов (в психологии - испытуемых, респондентов), специально отбираемая из генеральной совокупности для изучения ее свойств. Соответственно, изучение на выборке свойств генеральной совокупности называется выборочным исследованием. Практически все психологические исследования являются выборочными, а их выводы распространяются на генеральные совокупности.
К выборке применяется ряд обязательных требований, определенных, прежде всего, целями и задачами исследования. Она должна быть такой, чтобы обосновалась генерализация выводов выборочного исследования - обобщение, распространение их на генеральную совокупность.
Выборка должна удовлетворять следующим условиям:
1. Это группа объектов, доступная для изучения. Объем выборки определяется задачами и возможностями наблюдения и эксперимента.
2. Это часть заранее намеченной генеральной совокупности.
3. Это группа, отобранная случайным образом так, чтобы любой объект генеральной совокупности имел одинаковую вероятность попасть в выборку.
Основные критерии обоснованности выводов исследования - это репрезентативность выборки и статистическая достоверность (эмпирических) результатов.
Репрезентативность - иными словами, ее представительность - это способность характеризовать соответствующую генеральную совокупность с определенной точностью и достаточной надежностью. Если выборка испытуемых по своим характеристикам репрезентативна генеральной совокупности, то есть основания, полученные при ее изучении результаты распространить на всю генеральную совокупность.
В идеале репрезентативная выборка должна быть такой, чтобы каждая из основных изучаемых психологом характеристик, черт, особенностей личности и т. п. представлялась в ней пропорционально этим же особенностям в генеральной совокупности.
Ошибки репрезентативности возникают в двух случаях:
1. Малая выборка, характеризующая генеральную совокупность.
2. Несовпадение свойств (параметров) выборки с параметрами генеральной совокупности.
Статистическая достоверность , или статистическая значимость, результатов исследования определяется при помощи методов статистического вывода. Эти методы будут подробнее рассмотрены в теме «Проверка гипотез». Отметим, что они предъявляют определенные требования к численности, или объему выборки.
Наибольший объем выборки необходим при разработке диагностической методики - от 200 до 1000-2500 человек.
Если необходимо сравнить 2 выборки, их общая численность должна быть не менее 50 человек; численность сравниваемых выборок должна быть приблизительно одинаковой.
Если изучается взаимосвязь между какими-либо свойствами, то объем выборки должен быть не меньше 30-35 человек.
Чем больше изменчивость изучаемого свойства, тем больше должен быть объем выборки. Поэтому изменчивость можно уменьшить, увеличивая однородность выборки, например по полу, возрасту и т.д. При этом, естественно, уменьшаются возможности генерализации выводов.
Зависимые и независимые выборки. Обычна ситуация исследования, когда интересующее исследователя свойство изучается на двух или более выборках с целью их дальнейшего сравнения. Эти выборки могут находиться в различных соотношениях - в зависимости от процедуры их организации. Независимые выборки характеризуются тем, что вероятность отбора любого испытуемого одной выборки не зависит от отбора любого из испытуемых другой выборки. Напротив, зависимые выборки характеризуются тем, что каждому испытуемому одной выборки поставлен в соответствие по определенному критерию испытуемый из другой выборки.
Наиболее типичным примером независимой выборки является, например, сравнение мужчин и женщин по уровню интеллекта.
Генеральная совокупность – совокупность элементов, удовлетворяющих неким заданным условиям; именуется также изучаемой совокупностью. Генеральная совокупность (Universe) - все множество объектов (субъектов) исследования, из которого выбираются (могут выбираться) объекты (субъекты) для обследования (опроса).
ВЫБОРКА или выборочная совокупность (Sample) - это множество объектов (субъектов), отобранных специальным образом для обследования (опроса). Любые данные, полученные на основании выборочного обследования (опроса), имеют вероятностный характер. На практике это означает, что в ходе исследования определяется не конкретное значение, а интервал, в котором определяемое значение находится.
Характеристики выборки:
Качественная характеристика выборки – что именно мы выбираем и какие способы построения выборки мы для этого используем.
Количественная характеристика выборки – сколько случаев выбираем, другими словами объём выборки.
Необходимость выборки:
Объект исследования очень обширный. Например, потребители продукции глобальной компании – огромное количество территориально разбросанных рынков.
Существует необходимость в сборе первичной информации.
Объём выборки - число случаев, включённых в выборочную совокупность.
Зависимые и независимые выборки.
При сравнении двух (и более) выборок важным параметром является их зависимость. Если можно установить гомоморфную пару (то есть, когда одному случаю из выборки X соответствует один и только один случай из выборки Y и наоборот) для каждого случая в двух выборках (и это основание взаимосвязи является важным для измеряемого на выборках признака), такие выборки называются зависимыми .
В случае, если такая взаимосвязь между выборками отсутствует, то эти выборки считаются независимыми.
Типы выборки.
Выборки делятся на два типа:
Вероятностные;
Не вероятностные;
Репрезентативная выборка - выборочная совокупность, в которой основные характеристики совпадают с характеристиками генеральной совокупности. Только для этого типа выборки результаты обследования части единиц (объектов) можно распространять на всю генеральную совокупность. Необходимое условие для построения репрезентативной выборки - наличие информации о генеральной совокупности, т.е. либо полный список единиц (субъектов) генеральной совокупности, либо информация о структуре по характеристикам, существенно влияющим на отношение к предмету исследования.
17. Дискретный вариационный ряд, ранжирование, частота, частность.
Вариационным рядом (статистическим рядом) – называется последовательность вариант, записанных в порядке возрастания и соответствующих им весов.
Вариационный ряд может быть дискретным (выборка значений дискретной случайной величины) и непрерывным (интервальным) (выборка значений непрерывной случайной величины).
Дискретный вариационный ряд имеет вид:
Наблюдаемые значения случайной величины х1, х2, …, хk называются вариантами, а изменение этих значений называются варьированием.
Выборка (выборочная совокупность) – совокупность наблюдений, отобранных случайным образом из генеральной совокупности.
Число наблюдений в совокупности называется ее объемом.
N – объем генеральной совокупности.
n – объем выборки(сумма всех частот ряда).
Частотой варианты хi называется число ni (i=1,…,k), показывающее, сколько раз эта варианта встречается в выборке.
Частостью
(относительной частотой, долей) варианты хi (i=1,…,k) называется отношение ее частоты ni к объему выборки n.
wi
=ni
/n
Ранжирование опытных данных - операция, заключающаяся в том, что результаты наблюдений над случайной величиной, т. е. наблюдаемые значения случайной величины, располагают в порядке неубывания.
Дискретным вариационным рядом распределения называется ранжированная совокупность вариантов хi с соответствующими им частотами или частностями.
Понятие репрезентативности. Концептуальный объект и генеральная совокупность. Проектируемый объект. Проектируемая и реальная генеральная совокупности.
Мы знаем, что социологическая наука имеет дело не с текучей непосредственностью жизни, а с данными, организованными по определенным правилам в пространстве признаков. Под данными имеются в виду значения переменных, приписанные единицам исследования - объектам. Эти объекты - сообщества, институции, люди, тексты, вещи - образуют в пространстве признаков многообразные и нередко причудливые конфигурации, давая исследователю возможность высказывать обобщающие суждения о действительности.
Как только речь заходит о действительности, обнаруживается, что полученные данные относятся, строго говоря, только к регистрационным документам (анкетам, бланкам интервью, протоколам наблюдения и т. п.). Нет никаких гарантий, что действительность за окнами лаборатории (скажем, по ту сторону шкал) не окажется иной. До выборочной процедуры мы еще не дошли, но уже встает вопрос о репрезентативности данных: можно ли распространить сведения, полученные в процессе обследования, на объекты, находящиеся за пределами нашего конкретного опыта? Ответ однозначен: можно. В противном случае наши наблюдения не выходили бы за рамки «здесьи-теперь-совокупности». Они относились бы не к москвичам, а к тем, кто только что был опрошен по телефону в Москве; не к читателям газеты «Неделя», а к тем, кто прислал в редакцию по почте заполненный отрывной купон. После завершения опроса мы обязаны считать, что и «москвичи», и «читатели» остались прежними. Мы верим в стабильность мира потому, что научные наблюдения обнаруживают удивительное постоянство.
Любое единичное наблюдение распространяется на более широкую сферу наблюдений, и проблема репрезентации заключается в том, чтобы установить степень соответствия между параметрами обследованной совокупности и «реальными» характеристиками объекта. Выборочная процедура предназначена как раз для того, чтобы реконструировать реальный объект исследования и генеральную совокупность из отдельных моментных наблюдений.
Понятие выборочной репрезентативности близко понятию внешней валидности; только в первом случае производится экстраполяция одной и той же характеристики на более широкую совокупность единиц, а во втором - переход из одного смыслового контекста в другой. Выборочная процедура осуществляется каждым человеком тысячу раз на дню, при этом никто особенно не задумывается над репрезентативностью наблюдений. Опыт заменяет калькуляцию. Чтобы узнать, хорошо ли посолена каша, вовсе не обязательно съедать всю кастрюлю - здесь более эффективны методы неразрушающего контроля, в том числе выборочная проверка: нужно попробовать одну ложечку. При этом надо быть уверенным, что каша хорошо перемешана. Если каша перемешана плохо, имеет смысл провести не один замер, а серию, т. е. попробовать в разных местах кастрюли - это уже выборка. Сложнее убедиться в том, что ответ студента на экзамене репрезентирует его знания, а не является случайной удачей либо неудачей. Для этого и задаются несколько вопросов. Предполагается, что, если бы студент ответил на все возможные вопросы по предмету, результат был бы «истинный», т. е. отражал реальные знания. Но тогда никто не смог бы выдержать экзамен.
В основании выборочной процедуры всегда лежит «если бы» - предположение о том, что экстраполяция наблюдений существенноне изменит полученный результат. Поэтому генеральную совокупность можно определить как «объективную возможность» выборочной совокупности.
Проблема несколько усложняется, если разобраться в том, что имеется в виду под объектом исследования. Изучив достаточно многочисленную совокупность людей, социолог приходит к выводу, что переменная «радикализм-консерватизм» положительно коррелирует с возрастом: в частности, старшие поколения обнаруживают скорее консервативность, чем революционность. Но обследованный объект - выборочная совокупность - не существует в реальности как таковой. Он сконструирован процедурой отбора респондентов и проведения интервью, а затем сразу же исчезает, растворяется в массиве. Действительно, выборочная совокупность, с которой непосредственно «снимаются» данные, порождается процедурой, но в то же время она растворена в большой совокупности, которую представляет или репрезентирует с разной степенью точности и надежности. Социологические заключения относятся не к обследованным на прошлой неделе респондентам, а к идеализированным объектам: «старшим поколениям», «молодежи», тем, кто обнаруживает «радикализм» или «консерватизм». Речь идет о категориальных обобщениях, не ограниченных пространственно-временными обстоятельствами. В этом отношении выборочная процедура помогает освободиться от наблюдений и перейти в мир идей.
Таким образом, у нас есть возможность провести разграничение объекта исследования и генеральной совокупности: объект - не просто совокупность единиц, а понятие, в соответствии с которым осуществляется идентификация и отбор единиц исследования. В этом отношении справедливо гегелевское предписание считать истинным только то бытие, которое соответствует своему понятию. Теоретически объем понятия, обозначающего объект исследования, должен соответствовать объему генеральной совокупности. Однако такое соответствие достигается крайне редко.
Нам понадобится понятие концептуального объекта - идеального конструкта, обозначающего рамки темы. «Россияне», «аудитория центральных газет», «электорат», «демократическая общественность» - таковы типичные объекты исследовательского интереса социологов. Несомненно, концептуальному объекту должна соответствовать вполне реальная генеральная совокупность. Для этого необходимо предусмотреть еще один объект исследования - проектируемый объект. Проектируемый объект - это совокупность доступных исследователю единиц. Задача состоит в том, чтобы установить группы, являющиеся недоступными либо труднодоступными для сбора данных.
Очевидно, что обследовать объект, обозначаемый как «россияне», практически невозможно. Среди россиян немало людей находится в тюрьмах, исправительно-трудовых учреждениях, в следственных изоляторах и иных труднодоступных для интервьюера местах. Эту группу придется «вычесть» из проектируемого объекта. «Вычесть» придется и многих пациентов психиатрических больниц, детей, часть престарелых. Вряд ли гражданскому социологу удастся обеспечить нормальные шансы на попадание в выборку и военнослужащим. Аналогичные проблемы сопровождают обследование читателей, избирателей, жителей малых городов, посетителей театров.
Перечисленные затруднения - лишь малая часть тех, зачастую непреодолимых препятствий, с которыми сталкивается социолог на полевой стадии исследования. Специалист должен предвидеть эти затруднения и не строить иллюзий по поводу полной реализации проектируемого объекта. В противном случае его ждут разочарования.
Итак, объект исследования не совпадает с генеральной совокупностью примерно так же, как карта местности не совпадает с самой местностью.
Долго думали-гадали, Генералы все писали на большом листу. Было гладко на бумаге, да забыли про овраги, А по ним ходить, -
эти слова из старинной солдатской песни вполне применимы к проектированию выборки, если учесть, что ходить придется по квартирам.
Несомненно, генеральная совокупность - это та совокупность, из которой производится выборка единиц. Однако так только кажется. Выборка производится из той совокупности, из которой производится фактический отбор респондентов. Назовем ее реальной. Различия между проектируемой и реальной совокупностями можно увидеть воочию, сравнив списки «проектированных» респондентов и опрошенных фактически.
Реальный объект - та совокупность, которая сформировалась на стадии полевого исследования с учетом ограничений в доступности первичной социологической информации. Помимо заключенных, военнослужащих и больных, меньшую вероятность попасть в выборку имеют жители удаленных от транспортных коммуникаций сел, особенно если обследование производится осенью; те, кого, как правило, нет дома, не склонны к разговорам с посторонними людьми и т. п. Бывает, что интервьюеры, пользуясь отсутствием контроля, пренебрегают точным исполнением своих обязанностей и опрашивают не тех, кого положено опрашивать по инструкции, а тех, кого легче «достать». Например, посещать квартиры респондентов интервьюерам приказано по вечерам, когда легче застать их дома. Если исследование проводится, предположим, в ноябре, то уже в пять часов вечера в средней полосе России на улице совершенно темно. Во многих городах таблички с названиями улиц и номерами домов встречаются не часто. Если обязанности интервьюеров выполняют студентки местного пединститута, можно представить степень отклонения реального объекта от проектируемого. Иногда исследователи поступают еще проще: заполняют анкеты сами. Эти затруднения являются одним из источников так называемых систематических ошибок выборки.
Существуют достаточно эффективные способы контроля заполнения вопросников и приемы ремонта выборки, в частности «взвешивание» основных типологических групп респондентов: группы тех, кого не хватает, увеличиваются, а избыточные группы уменьшаются. Так реальный массив подгоняется под проектируемый и это вполне оправданно.