<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" media="screen" href="/~d/styles/rss2russianfull.xsl"?><?xml-stylesheet type="text/css" media="screen" href="http://feeds.feedburner.com/~d/styles/itemcontent.css"?><rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:sy="http://purl.org/rss/1.0/modules/syndication/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/" xmlns:feedburner="http://rssnamespace.org/feedburner/ext/1.0" version="2.0">

<channel>
	<title>Insight IT</title>
	
	<link>http://www.insight-it.ru</link>
	<description>Информационные технологии</description>
	<lastBuildDate>Tue, 19 Jan 2010 08:09:27 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.1</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="self" type="application/rss+xml" href="http://feeds.feedburner.com/insight-it/feed" /><feedburner:info uri="insight-it/feed" /><atom10:link xmlns:atom10="http://www.w3.org/2005/Atom" rel="hub" href="http://pubsubhubbub.appspot.com/" /><feedburner:emailServiceId>insight-it/feed</feedburner:emailServiceId><feedburner:feedburnerHostname>http://feedburner.google.com</feedburner:feedburnerHostname><feedburner:feedFlare href="http://add.my.yahoo.com/rss?url=http%3A%2F%2Ffeeds.feedburner.com%2Finsight-it%2Ffeed" src="http://us.i1.yimg.com/us.yimg.com/i/us/my/addtomyyahoo4.gif">Subscribe with My Yahoo!</feedburner:feedFlare><feedburner:feedFlare href="http://www.newsgator.com/ngs/subscriber/subext.aspx?url=http%3A%2F%2Ffeeds.feedburner.com%2Finsight-it%2Ffeed" src="http://www.newsgator.com/images/ngsub1.gif">Subscribe with NewsGator</feedburner:feedFlare><feedburner:feedFlare href="http://feeds.my.aol.com/add.jsp?url=http%3A%2F%2Ffeeds.feedburner.com%2Finsight-it%2Ffeed" src="http://o.aolcdn.com/favorites.my.aol.com/webmaster/ffclient/webroot/locale/en-US/images/myAOLButtonSmall.gif">Subscribe with My AOL</feedburner:feedFlare><feedburner:feedFlare href="http://www.bloglines.com/sub/http://feeds.feedburner.com/insight-it/feed" src="http://www.bloglines.com/images/sub_modern11.gif">Subscribe with Bloglines</feedburner:feedFlare><feedburner:feedFlare href="http://www.netvibes.com/subscribe.php?url=http%3A%2F%2Ffeeds.feedburner.com%2Finsight-it%2Ffeed" src="http://www.netvibes.com/img/add2netvibes.gif">Subscribe with Netvibes</feedburner:feedFlare><feedburner:feedFlare href="http://fusion.google.com/add?feedurl=http%3A%2F%2Ffeeds.feedburner.com%2Finsight-it%2Ffeed" src="http://buttons.googlesyndication.com/fusion/add.gif">Subscribe with Google</feedburner:feedFlare><feedburner:feedFlare href="http://www.pageflakes.com/subscribe.aspx?url=http%3A%2F%2Ffeeds.feedburner.com%2Finsight-it%2Ffeed" src="http://www.pageflakes.com/ImageFile.ashx?instanceId=Static_4&amp;fileName=ATP_blu_91x17.gif">Subscribe with Pageflakes</feedburner:feedFlare><feedburner:feedFlare href="http://lenta.yandex.ru/settings.xml?name=feed&amp;url=http%3A%2F%2Ffeeds.feedburner.com%2Finsight-it%2Ffeed" src="http://lenta.yandex.ru/i/addfeed.gif">?????? ? ??????.?????</feedburner:feedFlare><feedburner:feedFlare href="http://www.plusmo.com/add?url=http%3A%2F%2Ffeeds.feedburner.com%2Finsight-it%2Ffeed" src="http://plusmo.com/res/graphics/fbplusmo.gif">Subscribe with Plusmo</feedburner:feedFlare><feedburner:feedFlare href="http://www.thefreedictionary.com/_/hp/AddRSS.aspx?http%3A%2F%2Ffeeds.feedburner.com%2Finsight-it%2Ffeed" src="http://img.tfd.com/hp/addToTheFreeDictionary.gif">Subscribe with The Free Dictionary</feedburner:feedFlare><feedburner:feedFlare href="http://www.bitty.com/manual/?contenttype=rssfeed&amp;contentvalue=http%3A%2F%2Ffeeds.feedburner.com%2Finsight-it%2Ffeed" src="http://www.bitty.com/img/bittychicklet_91x17.gif">Subscribe with Bitty Browser</feedburner:feedFlare><feedburner:feedFlare href="http://www.newsalloy.com/?rss=http%3A%2F%2Ffeeds.feedburner.com%2Finsight-it%2Ffeed" src="http://www.newsalloy.com/subrss3.gif">Subscribe with NewsAlloy</feedburner:feedFlare><feedburner:feedFlare href="http://www.live.com/?add=http%3A%2F%2Ffeeds.feedburner.com%2Finsight-it%2Ffeed" src="http://tkfiles.storage.msn.com/x1piYkpqHC_35nIp1gLE68-wvzLZO8iXl_JMledmJQXP-XTBOLfmQv4zhj4MhcWEJh_GtoBIiAl1Mjh-ndp9k47If7hTaFno0mxW9_i3p_5qQw">Subscribe with Live.com</feedburner:feedFlare><feedburner:feedFlare href="http://mix.excite.eu/add?feedurl=http%3A%2F%2Ffeeds.feedburner.com%2Finsight-it%2Ffeed" src="http://image.excite.co.uk/mix/addtomix.gif">Subscribe with Excite MIX</feedburner:feedFlare><feedburner:feedFlare href="http://download.attensa.com/app/get_attensa.html?feedurl=http%3A%2F%2Ffeeds.feedburner.com%2Finsight-it%2Ffeed" src="http://www.attensa.com/blogs/attensa/WindowsLiveWriter/BadgeredintoBadges_10C02/attensa_feed_button5.gif">Subscribe with Attensa for Outlook</feedburner:feedFlare><feedburner:feedFlare href="http://www.webwag.com/wwgthis.php?url=http%3A%2F%2Ffeeds.feedburner.com%2Finsight-it%2Ffeed" src="http://www.webwag.com/images/wwgthis.gif">Subscribe with Webwag</feedburner:feedFlare><feedburner:feedFlare href="http://www.podcastready.com/oneclick_bookmark.php?url=http%3A%2F%2Ffeeds.feedburner.com%2Finsight-it%2Ffeed" src="http://www.podcastready.com/images/podcastready_button.gif">Subscribe with Podcast Ready</feedburner:feedFlare><feedburner:feedFlare href="http://www.flurry.com/pushRssFeed.do?r=fb&amp;url=http%3A%2F%2Ffeeds.feedburner.com%2Finsight-it%2Ffeed" src="http://www.flurry.com/images/flurry_rss_logo2.gif">Subscribe with Flurry</feedburner:feedFlare><feedburner:feedFlare href="http://www.wikio.com/subscribe?url=http%3A%2F%2Ffeeds.feedburner.com%2Finsight-it%2Ffeed" src="http://www.wikio.com/shared/img/add2wikio.gif">Subscribe with Wikio</feedburner:feedFlare><feedburner:feedFlare href="http://www.dailyrotation.com/index.php?feed=http%3A%2F%2Ffeeds.feedburner.com%2Finsight-it%2Ffeed" src="http://www.dailyrotation.com/rss-dr2.gif">Subscribe with Daily Rotation</feedburner:feedFlare><item>
		<title>Архитектура Plenty of Fish</title>
		<link>http://feedproxy.google.com/~r/insight-it/feed/~3/eIEGPMcolfA/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/arkhitektura-plenty-of-fish/#comments</comments>
		<pubDate>Mon, 18 Jan 2010 13:43:17 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[Akamai CDN]]></category>
		<category><![CDATA[ASP]]></category>
		<category><![CDATA[ASP .NET]]></category>
		<category><![CDATA[dating]]></category>
		<category><![CDATA[Foundry]]></category>
		<category><![CDATA[IIS]]></category>
		<category><![CDATA[Microsoft]]></category>
		<category><![CDATA[online]]></category>
		<category><![CDATA[Plenty of Fish]]></category>
		<category><![CDATA[POF]]></category>
		<category><![CDATA[ServerIron]]></category>
		<category><![CDATA[Windows]]></category>
		<category><![CDATA[Windows Server]]></category>
		<category><![CDATA[архитектура]]></category>
		<category><![CDATA[Архитектура Plenty of Fish]]></category>
		<category><![CDATA[сайт знакомств]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=492</guid>
		<description><![CDATA[Plenty of Fish представляет собой очень популярный сервис онлайн знакомств, насчитывающий более 45 миллионов посетителей в месяц и 30+ миллионов просмотров страниц в сутки (что составляет около 500-600 страниц в секунду). Но это не самая интересная часть истории... Все это управляется единственным человеком при использовании нескольких серверов, при этом он тратит на работу всего пару [...]]]></description>
			<content:encoded><![CDATA[
<p><a href="http://feedads.g.doubleclick.net/~a/rIMiFiC0THe1WCnjA__imzN5CIk/0/da"><img src="http://feedads.g.doubleclick.net/~a/rIMiFiC0THe1WCnjA__imzN5CIk/0/di" border="0" ismap="true"></img></a><br/>
<a href="http://feedads.g.doubleclick.net/~a/rIMiFiC0THe1WCnjA__imzN5CIk/1/da"><img src="http://feedads.g.doubleclick.net/~a/rIMiFiC0THe1WCnjA__imzN5CIk/1/di" border="0" ismap="true"></img></a></p><p><noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.plentyoffish.com/"  target="_blank" rel="external nofollow">Plenty of Fish</a></noindex> представляет собой очень популярный сервис онлайн знакомств, насчитывающий более 45 миллионов посетителей в месяц и 30+ миллионов просмотров страниц в сутки (что составляет около 500-600 страниц в секунду). Но это не самая интересная часть истории... Все это управляется единственным человеком при использовании нескольких серверов, при этом он тратит на работу всего пару часов в день и зарабатывает 6 миллионов долларов на рекламе от Google. Завидуете? Я тоже <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' />  Как же ему удалось соединить столько влюбленных пар, используя так мало ресурсов?<span id="more-492"></span></p>
<h2>Источники информации</h2>
<p><em>Данный пост является переводом <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://highscalability.com/plentyoffish-architecture"  target="_blank" rel="external nofollow">англоязычной статьи</a></noindex>, автор оригинала: Todd Hoff.</em></p>
<li><noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://channel9.msdn.com/ShowPost.aspx?PostID=331501#331501"  target="_blank" rel="external nofollow">Channel9 интервью с Markus Frind</a></noindex></li>
<li><noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://plentyoffish.wordpress.com/ target=" _blank" rel="external nofollow"">Блог Markus Frind</a></noindex></li>
<li><noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.readwriteweb.com/archives/plentyoffish_one_billion.php"  target="_blank" rel="external nofollow">Plentyoffish: компания одного человека может стоить 1 миллиард долларов</a></noindex><br />
<h2>Платформа</h2>
</li>
<li>Microsoft Windows</li>
<li>ASP.NET</li>
<li>IIS</li>
<li>Akamai CDN</li>
<li>Foundry ServerIron Load Balancer</li>
<h2>Статистика</h2>
</li>
<li>PlentyOfFish (POF) имеет 1.2 миллиарда просмотров страниц в месяц, в среднем 500 тысяч уникальных авторизованных пользователей в день. Пиковый сезон приходится на январь каждого года, когда эти цифры возрастают на 30%.</li>
<li>POF имеет единственного сотрудника: создатель и генеральный директор Markus Frind.</li>
<li>Зарабатывает до 10 миллионов долларов в год на рекламе от Google, работает при этом только около двух часов в день.</li>
<li>30+ миллионов просмотров страниц в день (500&nbsp;&mdash; 600 страниц в секунду).</li>
<li>1.2 миллиарда просмотров страниц  и 45 миллионов посетителей в месяц.</li>
<li>Имеет <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://ru.wikipedia.org/wiki/CTR_(%D0%B8%D0%BD%D1%82%D0%B5%D1%80%D0%BD%D0%B5%D1%82)"  target="_blank" rel="external nofollow">CTR</a></noindex> в 5-10 раз выше, чем Facebook.</li>
<li>Находится в top 30 сайтов США по данным Competes Attention, top 10 в Канаде и top 30 в Великобритании.</li>
<li>Нагрузка балансируется между двумя веб-серверами с 2 Quad Core Intel Xeon X5355 @ 2.66Ghz, 8GB RAM (используется около 800 MB), 2 жесткими дисками, работают под управлением Windows x64 Server 2003.</li>
<li>3 сервера баз данных. Информация об их конфигурации не предоставляется.</li>
<li>Приближается к 64000 одновременных соединений и 2 миллионам просмотрам страниц в час.</li>
<li>Интернет-канал в 1Gbps, из которых используется только 200Mbps.</li>
<li>1 TB трафика от отдачи 171 миллионов изображений через Akamai.</li>
<li>6TB система хранения данных для обработки миллионов полноразмерных изображений, которые загружаются на сайт каждый месяц.<br />
<h2>Что внутри?</h2>
</li>
<li>Модель монетизации заключалась в использовании рекламы от Google. Match.com, для сравнения, получает 300 миллионов долларов в год, в основном с платных подписок. Источник дохода POF должен измениться, чтобы позволить ему получать больше выручки от имеющихся пользователей. Планируется нанять больше сотрудников, в частности людей, которые будут заниматься продажей рекламы напрямую вместо того, чтобы полностью полагаться на AdSense.</li>
<li>При 30 миллионах просмотрах страниц в день можно зарабатывать неплохие деньги на рекламе, даже если <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://en.wikipedia.org/wiki/Cost_per_mille"  target="_blank" rel="external nofollow">CPM</a></noindex> будет всего 5-10 центов.</li>
<li>Akamai используется для отдачи более 100 миллионов изображений в день. Если на странице 8 изображений и каждое загружается за 100 миллисекунд&nbsp;&mdash; их загрузка займет почти секунду, так что распределение изображений целесообразно.</li>
<li>Десятки миллионов изображений отдаются с серверов POF, но большинство из них размером меньше 2KB и практически полностью закешированы в оперативной памяти.</li>
<li>Все динамично. Практически никакой статики.</li>
<li>Все исходящие данные сжимаются с использованием Gzip, что обходится всего 30% использованием процессорного времени. Используется много вычислительных ресурсов, но зато существенно сокращается использование пропускной способности интернет-канала.</li>
<li>Кэширование ASP .NET не используется, так как данные теряют свою актуальность практически сразу же.</li>
<li>Встроенные компоненты ASP также не используется. Почти все написано с чистого листа. Ничего не может быть более сложным, чем кучка простых if-then-else и циклов. Все максимально элементарно.</li>
<li>Балансировка нагрузки:<br />
&mdash; IIS  произвольно ограничивает общее количество соединений до 64000, таким образом балансировщик нагрузки был добавлен для обработки большего количества одновременных соединений. Вариант с добавлением второго IP адреса и использованием round robin DNS также рассматривался, но вариант с балансировщиком нагрузки выглядел более избыточным и позволял более легко расширять количество серверов. Помимо этого ServerIron позволял использовать более продвинутую функциональность, вроде блокировки ботов и балансировку запросов по cookies, сессиям или IP-адресам пользователей.<br />
&mdash; Windows Network Load Balancing (NLB) функция не использовалась, так как не поддерживает привязку сессий к серверам. Обходным путем было бы хранение сессионных данных в базе данных или общей файловой системе.<br />
&mdash; 8-12 NLB серверов могут объединяться в кластер и может использоваться неограниченное количество таких кластеров. Схема DNS round robin может использоваться для распределения запросов между кластерами. Теоретически такая архитектура могла бы позволить 70 веб-серверам обрабатывать более  300 тысяч одновременных соединений.<br />
&mdash; NLB имеет опцию для отправки каждого пользователя на конкретный сервер, таким образом не используется внешнее хранилище для сессионных данных и если сервер выходит из строя&nbsp;&mdash; пользователи просто разлогиниваются из системы. Если это состояние включает в себя например корзину интернет-магазина или какую-то другую важную информацию, то такой подход мог бы показаться неприемлемым, но для сайта знакомств это было бы не так критично.<br />
&mdash; Было решено, что хранение и получение сессионных данных программными средствами слишком дорого. Аппаратная балансировка нагрузка проще: пользователи просто назначаются конкретным серверам и в случае сбоя сервера назначенным ему пользователям предлагается пройти процесс авторизации еще раз.<br />
&mdash; Покупка ServerIron была дешевле и проще, чем использование NLB. Многие крупные сайты используют их для создания пулов TCP соединений, автоматическому определению ботов и так далее. ServerIron может делать намного больше, чем просто балансировать нагрузку и такие функции достаточно привлекательные за эту цену.</li>
<li>Была большая проблема с выбором системы размещения рекламы. Многие из них хотели несколько сотен тысяч в год и многолетний контракт.</li>
<li>В процессе избавления от ASP.NET повторителей и использование взамен конкатенации строк или response.write. Если у вас миллионы просмотров страниц в день&nbsp;&mdash; просто напишите весь код для отображения на экране пользователя.</li>
<li>Большинство изначальных вложений ушло на построение SAN. Избыточность любой ценой.</li>
<li>Рост был за счет вирусного эффекта. Портал начал набирать популярность в Канаде, затем о нем узнали в Великобритании и Австралии, и только потом в США.</li>
<li>База данных:<br />
&mdash; Одна база данных является основной.<br />
&mdash; Две базы данных для поиска. Поисковые запросы распределяются по их типу.<br />
&mdash; Производительность наблюдается через диспетчер задач. Когда появляются пики&nbsp;&mdash; ситуация рассматривается более детально. Проблемы обычно заключались в блокировках на уровне СУБД. Собственно говоря почти всегда это были проблемы с базами данных, очень редко они возникают на уровне .NET. Так как POF не использует библиотеки .NET, отследить проблемы с производительностью оказывается достаточно просто. Если бы использовалось много уровней framework&#39;ов, поиск мест, где скрываются проблемы, был бы трудным и утомляющим.<br />
&mdash; Если Вы делаете запрос к базе данных 20 раз при отображении одной страницы,  Вы проиграли в любом случае, вне зависимости от того, что Вы будете делать.<br />
&mdash; Разделяйте запросы чтения и записи к базе данных. Если у вас нет избыточного количества оперативной памяти не следование этому правилу может заставить систему зависнуть на несколько секунд.<br />
&mdash; Постарайтесь делать базы данных только для чтения.<br />
&mdash; Денормализуйте данные. Если Вам приходится доставать данные из 20 разных таблиц, попробуйте сделать просто одну таблицу, где будут лежать все нужные для чтения данные.<br />
&mdash; Один день может проработать почти что угодно, но когда Ваша база данных удвоится&nbsp;&mdash; использованные подход может внезапно перестать работать.<br />
&mdash; Если система делает только что-то одно, она будет делать это реально хорошо. Только записывайте данные и все будет нормально. Только читайте данные и все будет нормально. Делайте и то и другое&nbsp;&mdash; и все испортится. База данных погрязнет в проблемах с блокировками.<br />
&mdash; Если Вы полностью используете вычислительные мощности, Вы либо делаете что-то не так, либо Ваша система на самом деле очень оптимизирована. Если вы можете разместить всю базу в оперативной памяти&nbsp;&mdash; обязательно делайте это.</li>
<li>Процесс разработки выглядит примерно следующим образом: появляется идея, быстро реализуется и выдается пользователям в пределах 24 часов. Отклик от пользователей получается по слежению за тем, что они делают на сайте: выросло количество сообщений на пользователя? среднее время сессий выросло? Если пользователям новая фишка не пришлась по вкусу&nbsp;&mdash; просто уберите её.</li>
<li>При небольшом количестве серверов системные сбои достаточно редки и краткосрочны. Наибольшими сложностями были проблемы с DNS, когда некоторые интернет-провайдеры говорили, что POF больше не существует. Но так как сайт бесплатен, пользователи нормально относятся к небольшим периодам его недоступности. Люди часто не замечают простой сайта, так как думают, что это какая-то проблема у них, с интернет-соединением или еще чем-то.</li>
<li>Переход от миллиона пользователей к 12 миллионам пользователей был большим прыжком. Система может обслуживать и 60 миллионов пользователей с двумя веб-серверами.</li>
<li>Часто смотрите на конкурентов для идей новых функциональных возможностей.</li>
<li>Рассмотрите использование чего-то вроде S3, когда система начнет требовать географической балансировки.<br />
<h2>Подводим итоги</h2>
</li>
<li>Вам не нужны миллионы в финансировании, размашистая инфраструктура и целое здание сотрудников для того, чтобы создать вебсайт мирового уровня, который обслуживает кучу пользователей и приносит неплохие деньги. Все что нужно&nbsp;&mdash; всего лишь привлекательная идея, которая понравится большому количеству идей, сайт, который становится популярным благодаря слухам, а также опыт и видение для построения сайта, не наступая на типичные &laquo;грабли&raquo;. Вот и все, что Вам нужно <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':-)' class='wp-smiley' /> </li>
<li>Необходимость&nbsp;&mdash; мать всех изменений.</li>
<li>Когда вы растете быстро, но не слишком быстро, у Вас появляется шанса расти, модифицировать и адаптироваться.</li>
<li>Максимальное использование оперативной памяти решает массу проблем. После этого рост возможен просто за счет использование более мощных серверов.</li>
<li>В начале старайтесь держать все максимально простым. Практически все дают этот же самый совет, а Markus говорит, что все что он делает&nbsp;&mdash; всего лишь очевидный здравый смысл. Но то что просто, не всегда означает всего лишь осмысленную вещь. Создание простых вещей является результатом многих лет практического опыта.</li>
<li>Поддерживайте время доступа к базе данных быстрым и у Вас не будет проблем.</li>
<li>Одной из основных причин, по которой POF может работать с таким небольшим количеством сотрудников и оборудования, является использование CDN для отдачи активно используемого контента. Использование CDN может оказаться секретным соусом для многих крупных сайтов. Markus считает, что в top 100 не существует ни одного сайта, не использующего CDN. Без CDN время загрузки страницы в Австралии возросло бы до 3-4 секунд только за счет изображений.</li>
<li>Реклама на Facebook принесла плохие результаты. Из 2000 кликов только 1 человек регистрировался. С CTR равным 0.04% Facebook выдавал 0.4 клика на 1000 показов рекламы (CPM). При 5 центах CPM = 12.5 центов за клик, 50 центах CPM = 1.25$ за клик. 1 доллар CPM = 2.50$ за клик. 15$ CPM = 37.50$ за клик.</li>
<li>Это просто продавать несколько миллионов просмотров страниц с высоким CPM, но НАМНОГО сложнее продавать миллиарды просмотров с высоким CPM, как это делают Myspace и Facebook.</li>
<li>Модель монетизации, основанная на рекламе, ограничивает Ваши доходы. Вам придется переходить к платной модели чтобы повышать прибыль. Генерировать 100 миллионов долларов в год за счет бесплатного сайта  практически невозможно&nbsp;&mdash; Вам потребуется слишком большой рынок.</li>
<li>Повышение количества просмотров за счет Facebook не работает для сайтов знакомств. Иметь посетителя на собственном сайте намного более прибыльно. Большинство просмотров страниц на Facebook находятся за пределами США и Вам придется делить 5 центов CPM с Facebook.</li>
<li>Предложение пользователям при регистрации получить информацию об ипотеке или каком-то другом продукте, может стать неплохим источником дополнительной выручки.</li>
<li>Вы не можете постоянно прислушиваться к отзывам пользователей. Кому-то всегда будут нравиться новые функции, а кто-то всегда будет их ненавидеть, но только часть из них сообщит Вам об этом. Вместо этого лучше смотреть как новые функции влияют на то, чем люди на самом деле занимаются, просто смотря на Ваш сайт и статистику его использования.</li>
<div class="feedflare">
<a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=eIEGPMcolfA:95YQPAG6irI:yIl2AUoC8zA"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?d=yIl2AUoC8zA" border="0"></img></a> <a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=eIEGPMcolfA:95YQPAG6irI:F7zBnMyn0Lo"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?i=eIEGPMcolfA:95YQPAG6irI:F7zBnMyn0Lo" border="0"></img></a> <a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=eIEGPMcolfA:95YQPAG6irI:V_sGLiPBpWU"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?i=eIEGPMcolfA:95YQPAG6irI:V_sGLiPBpWU" border="0"></img></a>
</div><img src="http://feeds.feedburner.com/~r/insight-it/feed/~4/eIEGPMcolfA" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/arkhitektura-plenty-of-fish/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		<feedburner:origLink>http://www.insight-it.ru/masshtabiruemost/arkhitektura-plenty-of-fish/</feedburner:origLink></item>
		<item>
		<title>Aladdin от Baidu</title>
		<link>http://feedproxy.google.com/~r/insight-it/feed/~3/jKT3BrvZLzY/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/aladdin-ot-baidu/#comments</comments>
		<pubDate>Wed, 13 Jan 2010 21:01:12 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[Aladdin]]></category>
		<category><![CDATA[Baidu.com]]></category>
		<category><![CDATA[online]]></category>
		<category><![CDATA[поиск]]></category>
		<category><![CDATA[поисковые системы]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=407</guid>
		<description><![CDATA[
Наверняка все прекрасно знают о лидерах интернет-поиска в российской части интернета: про Google, Яндекс или Рамблер сказано уже не мало слов, все много раз о них читали, пользовались, обсуждали&#160;&#8212; ведь уже прошло больше 10 лет с момента создания каждой из этих поисковых систем и, как следствие, их конкуренции на просторах рунета. Намного меньше же внимания [...]]]></description>
			<content:encoded><![CDATA[
<p><a href="http://feedads.g.doubleclick.net/~a/cYG3W3fHxPHgaCmpdwd9OHMCu7o/0/da"><img src="http://feedads.g.doubleclick.net/~a/cYG3W3fHxPHgaCmpdwd9OHMCu7o/0/di" border="0" ismap="true"></img></a><br/>
<a href="http://feedads.g.doubleclick.net/~a/cYG3W3fHxPHgaCmpdwd9OHMCu7o/1/da"><img src="http://feedads.g.doubleclick.net/~a/cYG3W3fHxPHgaCmpdwd9OHMCu7o/1/di" border="0" ismap="true"></img></a></p><p><img title="Aladdin" src="http://www.insight-it.ru/wp-content/uploads/2009/12/left01.gif" alt="Aladdin Logo" width="643" height="176" /></p>
<p>Наверняка все прекрасно знают о лидерах интернет-поиска в российской части интернета: про Google, Яндекс или Рамблер сказано уже не мало слов, все много раз о них читали, пользовались, обсуждали&nbsp;&mdash; ведь уже прошло больше 10 лет с момента создания каждой из этих поисковых систем и, как следствие, их конкуренции на просторах рунета. Намного меньше же внимания на российских информационных сайтах уделяется национальным проектам других стран, а ведь среди них тоже есть заслуживающие внимания экземпляры, об одном из них я бы и хотел сегодня поведать.<br />
<span id="more-407"></span></p>
<h2>Источники данных</h2>
<ul>
<li><noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://tech.sina.com.cn/i/2009-12-16/14423683386.shtml"  target="_blank" rel="external nofollow">Baidu Aladdin Technology Guashudila</a></noindex></li>
<li><noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://tech.sina.com.cn/i/2009-08-18/16063362415.shtml"  target="_blank" rel="external nofollow">Rachel Liao, лекция директора по архитектуре Baidu</a></noindex></li>
<li><noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://news.xinhuanet.com/it/2006-04/06/content_4390847.htm"  target="_blank" rel="external nofollow">Baidu Chief Architect: алгоритмы на службе разработчиков Baidu</a></noindex></li>
<li><noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://baike.baidu.com/view/2086291.htm"  target="_blank" rel="external nofollow">Aladdin Plans</a></noindex></li>
</ul>
<p><em>Если кто-то достаточно любопытен, чтобы нажать на приведенные ссылки&nbsp;&mdash; они все на китайском, так что статья написана на основе перевода Google Translate со всеми вытекающими последствиями. Даже за название &laquo;Aladdin&raquo; не ручаюсь, его тоже он придумал <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </em></p>
<h2>О компании Baidu</h2>
<p><noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.baidu.com"  target="_blank" rel="external nofollow">Baidu.com</a></noindex> является лидером китайского рынка интернет-поиска, объем которого достаточно значителен. На данный момент Китай насчитывает около 340-360 миллионов интернет-пользователей, что превышает общую численность населения США. Не трудно представить с каким трафиком приходится сталкиваться крупнейшей китайской поисковой системе.</p>
<p>Чтобы не быть голословным, еще немного цифр о Baidu:</p>
<ul>
<li>100 миллионов поисковых запросов в день</li>
<li>Более миллиарда проиндексированных страниц</li>
<li>300-400 миллионов проиндексированных сайтов</li>
</ul>
<p>Уже на сегодняшний день размеры китайской части интернета производят впечатление и с каждым днем она расширяется все больше. Как следствие, на рынке образуются все новые и новые возможности для создания сервисов, удовлетворяющих потребности китайских пользователей Интернет. Компания <strong>Baidu Inc.</strong> пристально наблюдает за развитием ситуации и обнаружила огромную потребность среди сервис-провайдеров в удобной платформе для создания и предоставления пользователям новых сервисов. Baidu считает создание платформы для использования их технологии сторонними разработчиками и сервис-провайдерами очень важным направлением развития на пути к повышению качества пользовательского опыта в целом. Эти наблюдения стали толчком к рождению в рамках Baidu новой технологии под названием <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://open.baidu.com/"  target="_blank" rel="external nofollow">Aladdin</a></noindex>.</p>
<p>Как крупнейшей китайской поисковой системе, Baidu приходится быть чем-то большим, чем просто инструментом для поиска, это позволяет удовлетворять потребности потенциальных клиентов наиболее гармоничным и целесообразным образом. Помимо неустанной погони за технологическими инновациями, Baidu предпочитает придерживаться политики &laquo;потребности клиентов важнее всего&raquo;.</p>
<h2>Aladdin</h2>
<p>Согласно официальному сайту Baidu, эта технология представляет собой открытую поисковую платформу, позволяющую сторонним разработчикам использовать технологию Baidu в своих приложениях и сервисах. Владельцы интернет-проектов и разработчики могут предоставить Baidu данные в уже структурированном виде для того, чтобы создать еще более мощные и функционально-насыщенные приложения, позволяя интернет-сайтам получать еще более значимый трафик, а пользователям&nbsp;&mdash; еще больше облегчить использование сайтов и поиск в сети Интернет.</p>
<p>В декабре 2008 года Baidu объявили о высокоприоритетной программе под кодовым названием <em>&laquo;Aladdin&raquo;</em>, основной идеей была попытка расширить текущие рамки веб-поиска, по большей части за счет включения так называемого &laquo;глубинного интернета&raquo; в поисковую базу, проведения более глубокого анализа контента. Помимо этого упоминались возможность интеграции и управляемой обработки информации, направленных на минимизацию издержек поиска и времени обработки запроса при повышение общего качества поисковых результатов. В том же заявлении Baidu также описали их общую позицию по данному направлению: платформа Aladdin является надстройкой над текущей поисковой системой Baidu, позволяющей дополнение и расширение функциональных возможностей.</p>
<p>Согласно исследованиям Baidu, только 75% пользователей поисковых систем в конечном итоге удовлетворяют свои информационные потребности. В процессе анализа причин данного факта было выявлено, что в большом количестве случаев искомая информация находится на ресурсах по каким-то причинам находящимся вне доступа поисковых систем (начиная от технических ограничений, отсутствия внешних ссылок на ресурс и заканчивая искусственными барьерами вроде REP или принудительной авторизации).</p>
<p>Перед разработчиками Aladdin встают две основные проблемы с точки зрения технической реализации: &laquo;как определить пользовательские потребности&raquo; и &laquo;как сортировать&raquo;. Конечно же они очень тесно связаны между собой, это хорошо демонстрирует пример с поисковым запросом &laquo;полное солнечное затмение&raquo;: до затмения пользователи хотят когда оно будет и откуда лучше смотреть, а во время и после него намного актуальнее будет увидеть видео-запись или прямую трансляцию, а также прочитать и поделиться комментариями. Самым простым методом решения данного класса задач является статистический анализ&nbsp;&mdash; Aladdin выделяет два основных фактора, используемых для сортировки результатом в соответствии с потребностями пользователей: &laquo;удовлетворенность потребностей&raquo; и &laquo;уровень отклика на спрос&raquo;. Конечно же оценочные характеристики спроса и потребностей не означают сам спрос, то есть возможны и более сложные ситуации, когда за пользовательским запросом стоит целый комплекс более простых потребностей.</p>
<p>Алгоритмы, используемые в Aladdin для решения упомянутых проблем, основаны на машинном обучении, анализе поведения пользователей, а также обратной связи от использования технологии на практике. Конечная цель данной платформы заключается в построении целой интеллектуальной экосистемы,  которая станет новым шагом в развитии компании Baidu и китайской части интернета в целом.</p>
<h3>Возможности платформы</h3>
<p>С технической точки зрения Aladdin от Baidu представляет собой открытый API к поисковой технологии Baidu, позволяющий добавлять свои данные в структурированном виде в поисковый индекс, отмечать релевантные ключевые слова, методы отображения информации и пометки данных гео-метками.</p>
<p>Одним из важнейших направлений развития поисковых систем является повышение &laquo;интеллектуальности&raquo; поиска, Baidu уделяет внимание не только обнаружению более ценной информации в глубинах Интернета, но и предоставлению более удобных, точных и сообразительных поисковых сервисов.</p>
<p>На сегодняшний день, технология Aladdin была интегрирована в ряд приложений, позволив тем самым реализовать на страницах с результатами поиска множество интересных возможностей: прямой звонок клиенту для обсуждения каких-то товаров или услуг, интеграция с почтовым сервисом, прослушивание музыки с использованием встроенного flash-плеера и многие другие.</p>
<p>После обязательной процедуры подачи и рассмотрения заявки пользователям платформы Aladdin предоставляются следующие возможности:</p>
<ul>
<li>Добавление данных в индекс в структурированном виде</li>
<li>Указание ключевых слов для более точного прямого воздействия на целевую аудиторию</li>
<li>Управление сортировкой и отображением информационного контента</li>
<li>Управление стилем и внешним видом имеющихся ресурсов, причем не только текстовых</li>
<li>Выбор частоты обновления информации для синхронизации данных</li>
</ul>
<p>На первый взгляд все эти рассуждения и заявления о функциональных возможностях кажутся абсурдными, даже отчасти ироничными. Ну кому может понадобиться вручную управлять результатами поиска, добавлять и структурировать данные, возиться с сортировкой и внешним видом?</p>
<h3>Взгляд с другой стороны</h3>
<p>Да, вся платформа Aladdin по своей задумке очень искуственна: практически все делается вручную, но по сути это лишь процесс интеграции, а не работа с самим контентом. Для большинства других поисковых систем такой подход неприемлем: где найти столько людей, чтобы управлять огромными массивами данных вручную? Наоборот все поисковые системы стремятся по максимуму все автоматизировать и борятся с искуственным вмешательством в поисковый индекс (т.н. SEO), но... если вспомнить, что Baidu работает в Китае&nbsp;&mdash; вся затея начинает обретать здравый смысл. Как сама компания Baidu, так и большинство их потенциальных партнеров, клиентов и пользователей находится в примерно одинаковой ситуации: большое количество дешевой рабочей силы, относительно низкий уровень образования и профессиональной подготовки, а также прочие национальные особенности. В их ситуации не выгодно идти по пути Google и делать <em>основной</em> акцент на построении полностью автоматизированных систем анализа контента, добавления дополнительного материала к поисковым результатам и самим делать различные дополнительные приложения и сервисы. Намного выгоднее пойти по собственному пути, более адаптированному к ситуации в Китае, большое количество трудолюбивых людей позволяет строить сервисы коллективно, с привлечением партнеров, клиентов и заинтересованных лиц. Да, во многом вручную, за счет интеграции совершенно различных систем и сервисов, но зато более качественно и продуманно. В этом-то и заключается вся магия Китая.</p>
<div class="feedflare">
<a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=jKT3BrvZLzY:p__7g2KH7YE:yIl2AUoC8zA"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?d=yIl2AUoC8zA" border="0"></img></a> <a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=jKT3BrvZLzY:p__7g2KH7YE:F7zBnMyn0Lo"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?i=jKT3BrvZLzY:p__7g2KH7YE:F7zBnMyn0Lo" border="0"></img></a> <a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=jKT3BrvZLzY:p__7g2KH7YE:V_sGLiPBpWU"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?i=jKT3BrvZLzY:p__7g2KH7YE:V_sGLiPBpWU" border="0"></img></a>
</div><img src="http://feeds.feedburner.com/~r/insight-it/feed/~4/jKT3BrvZLzY" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/aladdin-ot-baidu/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		<feedburner:origLink>http://www.insight-it.ru/masshtabiruemost/aladdin-ot-baidu/</feedburner:origLink></item>
		<item>
		<title>Sun Unified Storage</title>
		<link>http://feedproxy.google.com/~r/insight-it/feed/~3/ni36dmSjeAY/</link>
		<comments>http://www.insight-it.ru/unix-way/unix/sun-unified-storage/#comments</comments>
		<pubDate>Wed, 13 Jan 2010 17:34:32 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Unix]]></category>
		<category><![CDATA[7410]]></category>
		<category><![CDATA[Solaris]]></category>
		<category><![CDATA[Sun]]></category>
		<category><![CDATA[Sun Unified Storage]]></category>
		<category><![CDATA[VirtualBox]]></category>
		<category><![CDATA[VMWare]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=497</guid>
		<description><![CDATA[По работе мне доводилось активно &#171;иметь дело&#187; с железкой от Sun под названием Sun Unified Storage 7410. Представляет собой достаточно мощную систему хранения данных с установленным Solaris, но доступом и управлением исключительно через веб-интерфейс. Основной &#171;фишкой&#187; системы является модульность: дисковый массив наращивается подключаемыми внешне дисковыми модулями по примерно 20-50ТБ, сетевой интерфейс также модульный&#160;&#8212; на выбор [...]]]></description>
			<content:encoded><![CDATA[
<p><a href="http://feedads.g.doubleclick.net/~a/A-78CpDp5HCrnHOqZz_uOQxoBHs/0/da"><img src="http://feedads.g.doubleclick.net/~a/A-78CpDp5HCrnHOqZz_uOQxoBHs/0/di" border="0" ismap="true"></img></a><br/>
<a href="http://feedads.g.doubleclick.net/~a/A-78CpDp5HCrnHOqZz_uOQxoBHs/1/da"><img src="http://feedads.g.doubleclick.net/~a/A-78CpDp5HCrnHOqZz_uOQxoBHs/1/di" border="0" ismap="true"></img></a></p><p>По работе мне доводилось активно &laquo;иметь дело&raquo; с железкой от Sun под названием <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.sun.com/storage/disk_systems/unified_storage/7410/"  rel="external nofollow" target="_blank">Sun Unified Storage 7410</a></noindex>. Представляет собой достаточно мощную систему хранения данных с установленным Solaris, но доступом и управлением исключительно через веб-интерфейс. Основной &laquo;фишкой&raquo; системы является модульность: дисковый массив наращивается подключаемыми внешне дисковыми модулями по примерно 20-50ТБ, сетевой интерфейс также модульный&nbsp;&mdash; на выбор начиная от нескольких обычных Ethernet по 1GBps и заканчивая оптоволокном, CX4 или InfiniBand. Две таких машины можно легко объединить в одну виртуальную для повышения надежности доступа к данным, подключив к ним общий дисковый массив. RAID используется софтверный средствами ZFS, вполне стандартный набор опций из зеркалирования, stripe, RAID5/6 и их комбинаций.</p>
<p>С точки зрения производительности тоже достаточно интересная штука: при подключении через 4x 1GBps Ethernet (с использованием LACP, но это тема для отдельного поста) определенно упирается в сеть, но все равно отлично подходит для использования в решении многих прикладных задач. Из интересных опций можно отметить прозрачное использование нескольких SSD-дисков в каждом дисковом массиве в роли кэша.</p>
<p>Все функции системы абсолютно прозрачны и настраиваются в несколько кликов через веб-интерфейс, командная строка хоть при желании и доступна, но практически не нужна. Там же можно увидеть статистику использования подсистем и прочую полезную информацию. В целом отличная система хранения данных: простая, надежная, быстрая, удобная, вместительная и масштабируемая, правда с одним большим НО&nbsp;&mdash; цена просто зашкаливает, прицениться можно, сходив по ссылке в начале записи, но вообще есть и более дешевые модели в этой серии.</p>
<p><em>К чему я это все вспомнил?</em> На почту пришел очередной рекламный буклет от Sun с <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/https://dct.sun.com/dct/forms/reg_us_1308_670_0.jsp"   rel="external nofollow" target="_blank">предложением попробовать Sun Unified Storage в виртуальной машине VirtualBox или VMWare</a></noindex>, сам еще не установил&nbsp;&mdash; времени не нашлось, но возможно Вам покажется интересным. Конечно это не совсем то же самое, что и физическая железка&nbsp;&mdash; производительность дисковых и сетевых подсиситем не померять, но веб-интерфейс заценить можно.</p>
<div class="feedflare">
<a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=ni36dmSjeAY:JBI2g-iui5U:yIl2AUoC8zA"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?d=yIl2AUoC8zA" border="0"></img></a> <a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=ni36dmSjeAY:JBI2g-iui5U:F7zBnMyn0Lo"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?i=ni36dmSjeAY:JBI2g-iui5U:F7zBnMyn0Lo" border="0"></img></a> <a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=ni36dmSjeAY:JBI2g-iui5U:V_sGLiPBpWU"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?i=ni36dmSjeAY:JBI2g-iui5U:V_sGLiPBpWU" border="0"></img></a>
</div><img src="http://feeds.feedburner.com/~r/insight-it/feed/~4/ni36dmSjeAY" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/unix-way/unix/sun-unified-storage/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		<feedburner:origLink>http://www.insight-it.ru/unix-way/unix/sun-unified-storage/</feedburner:origLink></item>
		<item>
		<title>Архитектура Stack Overflow</title>
		<link>http://feedproxy.google.com/~r/insight-it/feed/~3/b-KhrJBOK20/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/arkhitektura-stack-overflow/#comments</comments>
		<pubDate>Thu, 07 Jan 2010 21:31:47 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[ASP]]></category>
		<category><![CDATA[ASP .NET]]></category>
		<category><![CDATA[Beyond Compare 3]]></category>
		<category><![CDATA[C++]]></category>
		<category><![CDATA[highload]]></category>
		<category><![CDATA[JQuery]]></category>
		<category><![CDATA[Lenovo]]></category>
		<category><![CDATA[Lenovo ThinkServer]]></category>
		<category><![CDATA[LINQ]]></category>
		<category><![CDATA[Microsoft]]></category>
		<category><![CDATA[MSSQL]]></category>
		<category><![CDATA[MVC]]></category>
		<category><![CDATA[Server Fault]]></category>
		<category><![CDATA[SQL Server 2008]]></category>
		<category><![CDATA[Stack Overflow]]></category>
		<category><![CDATA[Subversion]]></category>
		<category><![CDATA[Super User]]></category>
		<category><![CDATA[Visual Studio 2008 Team Suite]]></category>
		<category><![CDATA[VisualSVN]]></category>
		<category><![CDATA[архитектура]]></category>
		<category><![CDATA[архитектура Stack Overflow]]></category>
		<category><![CDATA[архитектура высоконагруженных сайтов]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=466</guid>
		<description><![CDATA[
Stack Overflow является любимым многими программистами сайтом, где можно задать профессиональный вопрос и получить ответы от коллег. Этот проект был написан двумя никому не известными парнями, о которых никто никогда раньше не слышал. Хорошо, не совсем так. Stack Overflow был создан топовыми программистами и звездами блогосферы: Jeff Atwood и Joel Spolsky. В этом отношении Stack Overflow похож [...]]]></description>
			<content:encoded><![CDATA[
<p><a href="http://feedads.g.doubleclick.net/~a/79K1fXqM1YWFPH0VWGvAhcvo_w0/0/da"><img src="http://feedads.g.doubleclick.net/~a/79K1fXqM1YWFPH0VWGvAhcvo_w0/0/di" border="0" ismap="true"></img></a><br/>
<a href="http://feedads.g.doubleclick.net/~a/79K1fXqM1YWFPH0VWGvAhcvo_w0/1/da"><img src="http://feedads.g.doubleclick.net/~a/79K1fXqM1YWFPH0VWGvAhcvo_w0/1/di" border="0" ismap="true"></img></a></p><p><img class="size-full wp-image-475 alignright" style="float: right; margin: 8px; border: 1px solid #aaa;" title="Stack Overflow" src="http://www.insight-it.ru/wp-content/uploads/2010/01/logo.gif" alt="Stack Overflow" width="250" height="61" /></p>
<p><noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://stackoverflow.com/" rel="external nofollow"  target="_blank">Stack Overflow</a></noindex> является любимым многими программистами сайтом, где можно задать профессиональный вопрос и получить ответы от коллег. Этот проект был написан двумя никому не известными парнями, о которых никто никогда раньше не слышал. Хорошо, не совсем так. Stack Overflow был создан топовыми программистами и звездами блогосферы: <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.codinghorror.com/blog/" rel="external nofollow"  target="_blank">Jeff Atwood</a></noindex> и <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.joelonsoftware.com/" rel="external nofollow"  target="_blank">Joel Spolsky</a></noindex>. В этом отношении Stack Overflow похож на ресторан, владельцами которого являются знаменитости. По оценкам Joel&#39;а около 1/3 программистов всего мира использовали этот интернет-ресурс, так что должно быть он представляет собой что-то достаточно полезное и интересное.</p>
<p>Одним из ключевых моментов в истории Stack Overflow является использование вертикального масштабирования, как достаточно работоспособного решения достаточного большого класса проблем. Не смотря на то, что публика на сегодняшний день больше склоняется к подходу с использованием горизонтальным масштабирования и не-SQL баз данных.</p>
<p>Если Вы стремитесь к масштабу Google, у Вас нет другого выхода, как двигаться в направлении не-SQL. Но Stack Overflow&nbsp;&mdash; это не Google, ровно как и подавляющее большинство других сайтов. Когда Вы задумываетесь о возможных вариантов дизайна Вашего проекта, попробуйте учесть и историю Stack Overflow, она тоже имеет право на жизнь. В этот век многоядерных машин с большим объемом оперативной памяти и невероятными темпами развития методов параллельного программирования, вертикальное масштабирование все еще является жизнеспособной стратегией и не должна сразу же отбрасываться в сторону просто так как это теперь больше не модно. Возможно в один прекрасный день мы получим лучшее из обоих миров, но на сегодняшний момент перед нами лежит большой болезненный выбор стратегии масштабирования, от которого определенно зависит судьба Вашего проекта.</p>
<p>Joel любит похвастаться тем, что они достигли производительности, сравнимой с другими сайтами аналогичных размеров, используя в 10 раз меньше оборудования. Он удивляется, работали над этими сайтами по-настоящему хорошие программисты. Давайте взглянем на то, как им это удалось, и дадим Вам возможность побыть судьей.</p>
<p><span id="more-466"></span></p>
<p><em>Перевод <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://highscalability.com/blog/2009/8/5/stack-overflow-architecture.html" rel="external nofollow"  target="_blank">статьи</a></noindex>, автор оригинала&nbsp;&mdash; Todd Hoff. Возможно будет еще один пост с менее формальной информацией на ту же тему.</em></p>
<h2>Статистика</h2>
<li>16 миллионов просмотров страниц в месяц</li>
<li>3 миллионов уникальных пользователей в месяц (для сравнения: Facebook насчитывает около 77 миллионов уникальных пользователей в месяц)</li>
<li>6 миллионов посещений в месяц</li>
<li>86% трафика приходит с Google</li>
<li>9 миллионов активных программистов во всем мире и 30% пользуются Stack Overflow</li>
<li>Более дешевые лицензии были получены через программу Microsoft <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.microsoft.com/BizSpark" rel="external nofollow"  target="_blank"></a></noindex>BizSpark. Скорее всего они заплатили около 11000$ за лицензии на ОС и MSSQL.</li>
<li>Стратегия монетизации: ненавязчивая реклама, вакансии, конференции DevDays, достижения других смежных ниш (Server Fault, Super User), разработка <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://stackexchange.com/" rel="external nofollow"  target="_blank">StackExchange</a></noindex> и возможно каких-то других систем рейтингов для программистов.<br />
<h2>Платформа</h2>
</li>
<li>Microsoft ASP.NET MVC</li>
<li>SQL Server 2008</li>
<li>C#</li>
<li>Visual Studio 2008 Team Suite</li>
<li>JQuery</li>
<li>LINQ to SQL</li>
<li>Subversion</li>
<li>Beyond Compare 3</li>
<li>VisualSVN 1.5</li>
<li>Веб уровень:<br />
&mdash; 2 x Lenovo ThinkServer RS110 1U<br />
&mdash; 4 ядра, 2.83 Ghz, 12 MB L2 cache<br />
&mdash; 500 GB жесткие диски, зеркалирование RAID1<br />
&mdash; 8 GB RAM</li>
<li>Уровень базы данных:<br />
&mdash; 1 x Lenovo ThinkServer RD120 2U<br />
&mdash; 8 ядер, 2.5 Ghz, 24 MB L2 cache<br />
&mdash; 48 GB RAM</li>
<li>Четвертый сервер был добавлен для запуска <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://superuser.com/" rel="external nofollow"  target="_blank">superuser.com</a></noindex>. Все сервера вместе обеспечивают работу <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://stackoverflow.com/" rel="external nofollow"  target="_blank">Stack Overflow</a></noindex>, <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://serverfault.com/" rel="external nofollow"  target="_blank">Server Fault</a></noindex>, и <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://superuser.com/" rel="external nofollow"  target="_blank">Super User</a></noindex>.</li>
<li>QNAP TS-409U NAS для резервного копирования данных. Было принято решение не использовать &laquo;облачные&raquo; решения, так как вызванные ими дополнительные 5GB трафика ежедневно были бы накладными.</li>
<li>Сервера располагаются у <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.peakinternet.com/" rel="external nofollow"  target="_blank">Peak Internet</a></noindex>. В основном из-за впечатляющей детализации технических ответов и разумных расценок.</li>
<li>Полнотекстный поиск в SQL Server активно используется для реализации поиска по сайту и выявления повторных вопросов. Lucene .NET рассматривается как достаточно заманчивая альтернатива.<br />
<h2>Подводим итоги</h2>
Данный список является сборником уроков от Jeff и Joel, а также из комментариев к их записям:</li>
<li>Если Вы комфортно себя чувствуете в деле управления серверами&nbsp;&mdash; не бойтесь покупать их. Две основных проблемы с издержками аренды оборудования: 1) невероятные цены на дополнительную оперативную память и жесткие диски 2) хостинг-провайдеры на самом деле не могут управлять чем-либо за Вас.</li>
<li>Делайте одноразовые более крупные инвестиции в оборудование, чтобы избежать быстро растущих ежемесячных издержек по аренде, которые окажутся более высокими в долгосрочном периоде.</li>
<li>Обновляйте сетевые драйвера. Производительность запросто может удвоиться.</li>
<li>Использование 48GB RAM требует обновления до MS Enterprise edition.</li>
<li>Оперативная память невероятно дешевая. Используйте возможности по её расширению по максимуму для получения практически бесплатной производительности. У Dell, например, переход от 4GB памяти до 128GB стоит всего 4378$.</li>
<li>Stack Overflow скопировали ключевую часть структуры базы данных у Wikipedia. Это обернулось огромной ошибкой, для исправления которой потребуется большой и болезненный рефакторинг базы данных. Основным направлением изменений будет избавление от излишних операций по объединению данных в большом количестве ключевых запросов. Это ключевой урок, который стоит усвоить у гигантских много-терабайтных схем (вроде Google BigTable), которые полностью избавлены от операций объединения данных. Этот вопрос был достаточно важен для Stack Overflow, так как их база данных практически полностью располагается в оперативной памяти и операции join по прежнему требуют относительно много вычислительных ресурсов.</li>
<li>Производительность CPU оказывается на удивление важным фактором для серверов баз данных. Переход от 1.86 GHz, к 2.5 GHz, и к 3.5 GHz процессорам дает практически линейный прирост к времени выполнения типичных запросов. Исключение: запросы, которые затрагивают не только оперативную память.</li>
<li>Когда оборудование арендуется, обычно никто не платит за дополнительную оперативную память, если только вы не на помесячном контракте.</li>
<li>В 90% случаев наиболее узким местом является база данных.</li>
<li>При небольшом количестве серверов,  ключевым компонентом издержек становится не место в стойках, электроэнергия, интернет-канал, сервера или программное обеспечение, а СЕТЕВОЕ ОБОРУДОВАНИЕ. Вам потребуется как минимум гигабитное соединение между уровнями веб-серверов и баз данных. Между интернетом и веб-серверами потребуется firewall, маршрутизатор и VPN. К моменту добавления второго веб-сервера понадобится решение для балансировки нагрузки. Суммарная стоимость такого оборудования может запросто вдвое превосходить стоимость пяти серверов.</li>
<li>EC2 предназначен для горизонтального масштабирования, для того чтобы нагрузка могла быть распределена между большим количеством машин (достаточно хорошая идея, если Вы планируете расширяться). Еще больше смысла в таком подходе появляется, если вы планируете масштабироваться по необходимости (то есть добавлять и убирать машины в зависимости от уровня нагрузки).</li>
<li>Горизонтальное масштабирование может проходить относительно безболезненно только при использовании open source программного обеспечения. В противном случае вертикальное масштабирование значит сокращение издержек, связанных с лицензиями, в ущерб стоимости оборудования, а горизонтальное масштабирование&nbsp;&mdash; наоборот: экономия на оборудовании, но требуется существенно больше лицензий на программное обеспечение.</li>
<li>RAID-10 отлично работает для баз данных с высокой нагрузкой операций чтения и записи.</li>
<li>Разделяйте работу приложений и баз данных таким образом, чтобы они могли масштабироваться независимо друг от друга. Например, базы данных могут  масштабироваться вертикально, а сервера приложений&nbsp;&mdash; горизонтально.</li>
<li>Приложения должны хранить все информацию о своем состоянии в базе данных для обеспечения возможности роста путем простого добавления серверов приложений в кластер.</li>
<li>Одна из основных проблем со стратегией вертикального масштабирования&nbsp;&mdash; недостаток избыточности. Кластеризация добавляет надежности, но когда стоимость каждого сервера высока&nbsp;&mdash; это не так просто реализовать.</li>
<li>Некоторые приложения могут масштабироваться линейно относительно числа процессоров. Но зачастую будут использоваться механизмы блокировки, что приведет к сериализации вычислений и в итоге к существенному уменьшению эффективности приложения.</li>
<li>С более крупными серверами, занимающими от 7U в стойке, электроэнергия и охлаждение становятся критичными вопросами. Возможно использование чего-то среднего между 1U и 7U может облегчить Ваши взаимоотношения с датацентром.</li>
<li>С добавлением все новых и новых серверов баз данных издержки на лицензии SQL Server могут стать очень существенными. Если Вы начнете с вертикального масштабирования и постепенно начнете переходить к горизонтальному с использованием не open source продуктов, возможно это сильно ударит по Вашему финансовому состоянию. Это справедливо, что в этой заметке речь идет не совсем об архитектуре проекта. Мы знаем об их серверах, об используемом наборе инструментов, об их двухуровневой схеме, где база данных используется напрямую из кода веб-серверов. Но мы не знаем практически ничего о самой реализации, например таких мелочей как теги. Если Вам интересен этот вопрос, возможно Вам удастся получить интересующую Вас информацию из <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://sqlserverpedia.com/wiki/Understanding_the_StackOverflow_Database_Schema" rel="external nofollow"  target="_blank">описания их схемы базы данных</a></noindex>.</li>
<div class="feedflare">
<a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=b-KhrJBOK20:Y9hDUkhrDyE:yIl2AUoC8zA"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?d=yIl2AUoC8zA" border="0"></img></a> <a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=b-KhrJBOK20:Y9hDUkhrDyE:F7zBnMyn0Lo"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?i=b-KhrJBOK20:Y9hDUkhrDyE:F7zBnMyn0Lo" border="0"></img></a> <a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=b-KhrJBOK20:Y9hDUkhrDyE:V_sGLiPBpWU"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?i=b-KhrJBOK20:Y9hDUkhrDyE:V_sGLiPBpWU" border="0"></img></a>
</div><img src="http://feeds.feedburner.com/~r/insight-it/feed/~4/b-KhrJBOK20" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/arkhitektura-stack-overflow/feed/</wfw:commentRss>
		<slash:comments>9</slash:comments>
		<feedburner:origLink>http://www.insight-it.ru/masshtabiruemost/arkhitektura-stack-overflow/</feedburner:origLink></item>
		<item>
		<title>Terrastore</title>
		<link>http://feedproxy.google.com/~r/insight-it/feed/~3/lP9SJ2aL9tA/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/terrastore/#comments</comments>
		<pubDate>Wed, 06 Jan 2010 22:22:03 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[HTTP]]></category>
		<category><![CDATA[Terracotta]]></category>
		<category><![CDATA[Terrastore]]></category>
		<category><![CDATA[документы]]></category>
		<category><![CDATA[хранение]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=449</guid>
		<description><![CDATA[Terrastore является свежеиспеченной системой хранения документов, с отличными возможностями по масштабируемости и эластичной настройке, при этом без жертв со стороны консистентности данных.
Вместо подробного описания несколько ключевых характеристик продукта:

Легкодоступность: данные доступны посредством повсеместно используемого протокола HTTP.
Распреденность: узлы могут работать и существовать на любых доступных серверах.
Эластичность: имеется возможность динамического добавления и удаления узлов кластера на лету, без [...]]]></description>
			<content:encoded><![CDATA[
<p><a href="http://feedads.g.doubleclick.net/~a/dI6JWW-_1Po0WAZuHiPFMzMrhqg/0/da"><img src="http://feedads.g.doubleclick.net/~a/dI6JWW-_1Po0WAZuHiPFMzMrhqg/0/di" border="0" ismap="true"></img></a><br/>
<a href="http://feedads.g.doubleclick.net/~a/dI6JWW-_1Po0WAZuHiPFMzMrhqg/1/da"><img src="http://feedads.g.doubleclick.net/~a/dI6JWW-_1Po0WAZuHiPFMzMrhqg/1/di" border="0" ismap="true"></img></a></p><p><noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://code.google.com/p/terrastore/" rel="external nofollow"  target="_blank">Terrastore</a></noindex> является свежеиспеченной системой хранения документов, с отличными возможностями по масштабируемости и эластичной настройке, при этом без жертв со стороны консистентности данных.</p>
<p>Вместо подробного описания несколько ключевых характеристик продукта:</p>
<ul>
<li><strong>Легкодоступность:</strong> данные доступны посредством повсеместно используемого протокола HTTP.</li>
<li><strong>Распреденность:</strong> узлы могут работать и существовать на любых доступных серверах.</li>
<li><strong>Эластичность:</strong> имеется возможность динамического добавления и удаления узлов кластера на лету, без малейшего простоя системы и каких-либо изменений в конфигурации.</li>
<li><strong>Масштабируемость на уровне данных:</strong> документы разбиваются на группы и распределяются между доступными узлами с автоматической прозрачной балансировкой, в том числе и при добавлении и исключении узлов в кластере.</li>
<li><strong>Масштабируемость на вычислительном уровне:</strong> запросы и обновление данных распределяются по узлам, которые физически хранят используемые данные, тем самым минимизируется трафик и распределяется вычислительная нагрузка.</li>
<li><strong>Консистентность:</strong> система обеспечивает по-документную консистентность данных, таким образом гарантируя тот факт, что пользователь всегда получает самую свежую версию документа, обеспечивая изоляцию для параллельных модификаций документов.</li>
<li><strong>Отсутствие схемы:</strong> предоставляет JSON интерфейс, основанный на коллекциях; пользователям предоставляется возможность просто создать свою коллекцию и положить туда что угодно.</li>
<li><strong>Простота в работе:</strong> установка полностью работоспособного кластера заключается в вводе всего нескольких команд и не требует какого-либо редактирование XML-конфигов.</li>
<li><strong>Богатый функционал:</strong> поддерживаются push-down предикаты, запросы по диапазонам и серверные функции обновления.</li>
</ul>
<p>Если Вам показалось интересным, у Вас есть возможность <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://code.google.com/p/terrastore/" rel="external nofollow"  target="_blank">получить более подробную информацию</a></noindex>, <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://groups.google.com/group/terrastore-discussions" rel="external nofollow"  target="_blank">принять участие в проекте</a></noindex>, <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://code.google.com/p/terrastore/downloads/list" rel="external nofollow"  target="_blank">скачать дистрибутив</a></noindex> или <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://code.google.com/p/terrastore/source/createClone" rel="external nofollow"  target="_blank">получить копию исходного кода</a></noindex>!<br />
﻿<span id="more-449"></span><br />
<em> В очередной раз спасибо </em><noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://highscalability.com/blog/2009/12/30/terrastore-scalable-elastic-consistent-document-store.html" rel="external nofollow"  target="_blank"><em>highscalability.com за источник информации</em></a></noindex><em>, за одно хотелось бы услышать мнения о таком формате постов. Я тут уже почти неделю копаюсь над постом-долгостроем про Baidu, а такой можно сочинить за полчаса.</em></p>
<p><em>Кстати про </em><noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.terracotta.org" rel="external nofollow"  target="_blank"><em>Terracotta</em></a></noindex><em>, на основе которой работает данный продукт, тоже давно пора было уже написать, в ближайшее время займусь <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </em></p>
<div class="feedflare">
<a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=lP9SJ2aL9tA:vue-Lt3CYHk:yIl2AUoC8zA"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?d=yIl2AUoC8zA" border="0"></img></a> <a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=lP9SJ2aL9tA:vue-Lt3CYHk:F7zBnMyn0Lo"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?i=lP9SJ2aL9tA:vue-Lt3CYHk:F7zBnMyn0Lo" border="0"></img></a> <a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=lP9SJ2aL9tA:vue-Lt3CYHk:V_sGLiPBpWU"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?i=lP9SJ2aL9tA:vue-Lt3CYHk:V_sGLiPBpWU" border="0"></img></a>
</div><img src="http://feeds.feedburner.com/~r/insight-it/feed/~4/lP9SJ2aL9tA" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/terrastore/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		<feedburner:origLink>http://www.insight-it.ru/masshtabiruemost/terrastore/</feedburner:origLink></item>
		<item>
		<title>Нам два годика</title>
		<link>http://feedproxy.google.com/~r/insight-it/feed/~3/n3hEEXCMh9w/</link>
		<comments>http://www.insight-it.ru/life/wordpress/nam-dva-godika/#comments</comments>
		<pubDate>Sun, 03 Jan 2010 20:59:22 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[WordPress]]></category>
		<category><![CDATA[online]]></category>
		<category><![CDATA[День Рождения]]></category>
		<category><![CDATA[ДР]]></category>
		<category><![CDATA[интернет]]></category>
		<category><![CDATA[итоги года]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=439</guid>
		<description><![CDATA[В общем судя по всему я решил считать 3 января 2008 года Днем Рождения Insight IT, так что как раз самое время написать очередной бестолковый &#171;праздничный&#187; пост, по совместительству выполняющий роль &#171;новогоднего&#187; (надо же поздравить всех читателей с Наступившим, хоть и несколько поздновато; отметил я просто замечательно и три дня провел без интернета). В повестке дня [...]]]></description>
			<content:encoded><![CDATA[
<p><a href="http://feedads.g.doubleclick.net/~a/lbxZ4P0NUbK8vbhRB-3jkIdNB6Y/0/da"><img src="http://feedads.g.doubleclick.net/~a/lbxZ4P0NUbK8vbhRB-3jkIdNB6Y/0/di" border="0" ismap="true"></img></a><br/>
<a href="http://feedads.g.doubleclick.net/~a/lbxZ4P0NUbK8vbhRB-3jkIdNB6Y/1/da"><img src="http://feedads.g.doubleclick.net/~a/lbxZ4P0NUbK8vbhRB-3jkIdNB6Y/1/di" border="0" ismap="true"></img></a></p><p>В общем судя по всему я решил считать 3 января 2008 года Днем Рождения <strong>Insight IT</strong>, так что как раз самое время написать очередной бестолковый &laquo;праздничный&raquo; пост, по совместительству выполняющий роль &laquo;новогоднего&raquo; (надо же поздравить всех читателей с Наступившим, хоть и несколько поздновато; отметил я просто замечательно и три дня провел без интернета). В повестке дня у нас сегодня обзор основных событий прошедшего года и планы на наступивший, кому интересно&nbsp;&mdash; читаем дальше <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /> <span id="more-439"></span></p>
<p><img title="Далее..." src="http://www.insight-it.ru/wp-includes/js/tinymce/plugins/wordpress/img/trans.gif" alt="" />Как не сложно увидеть по датам постов&nbsp;&mdash; первые 10 месяцев года прошли очень пассивно для данного блога. Я был весь в работе и учебе, постов писал мало, на комментарии отвечал редко&nbsp;&mdash; в общем халтурил по полной программе. Впрочем время для меня зря не прошло&nbsp;&mdash; успел получить степень бакалавра Бизнес-Информатики и поступить в магистратуру на программу &laquo;Электронный бизнес&raquo;. В дополнение к общему затишью ложку дегтя добавлял теперь уже бывший хостинг провайдер (по прежнему не хочу устраивать анти-рекламу, российская компания с доменом из двух букв, кому было интересно уже наверное давно успели посмотреть)&nbsp;&mdash; возможно кто-то из читателей помнит эти регулярные проблемы с доступностью сайта, некоторые из которых даже доходили до простоев более двух недель подряд.</p>
<p>На этом в общем-то негативные стороны заканчиваются, так что перейдем к положительным моментам. Во-первых, блог переехал-таки на новый хостинг в США: там существенно более ответственно относятся к клиентам, отличная техподдержка, пока никаких сбоев, современное оборудование, никаких фиксированных ограничений по трафику/дисковому пространству/процессорному времени/чему-то еще в этом духе&nbsp;&mdash; в целом пока вижу в данном решении почти только плюсы, из минусов разве что чуть больший пинг и цена на 500р./год выше. Во-вторых, в октябре я остался без работы&nbsp;&mdash; про это я уже рассказывал достаточно подробно, повторяться не буду. В общем у меня стало появляться существенно больше свободного времени, которое я мог позволить себе тратить на блог. Не трудно заметить возросшую активность как в постах, так и в комментариях, циферки в статистике <em>Google Analytics</em>, <em>Feedburner</em> и <em>Wordpress.com Stats</em> достаточно резво растут вверх и я надеюсь, что эта тенденция продолжится и на протяжении всего наступившего года. Уже накопилась масса идей для новых постов&nbsp;&mdash; осталось только найти в себе силы материализовать их.</p>
<p>Вообще я уже почти три месяца сижу без работы и почему-то чем дальше&nbsp;&mdash; тем менее активно ищу новую. Некоторое время назад, примерно одновременно с принятием решения о смене хостинга, мне пришла в голову идея попробовать зарабатывать на <strong>Insight IT</strong>, чтобы позволить себе оттягивать <a href="/resume" target="_blank">процесс поиска работы</a> как можно дальше. Сначала попробовал наиболее &laquo;гуманный&raquo; по отношению к читателям метод, который более-менее сносно работал в 2008 году&nbsp;&mdash; поставил побольше блоков <em>Google AdSense</em>. Оказалось больше не работает, цены за клик упали в 3-5 раз, да и CTR ниже плинтуса. Этот факт подтолкнул меня создать появившуюся в меню навигации несколько дней назад страничку <a href="/reklama" target="_blank"><em>&laquo;Реклама&raquo;</em></a> (возможно кто-то уже успел ознакомиться), основная идея&nbsp;&mdash; я готов размещать ту или иную форму рекламы напрямую, без посредников в виде бирж или каких-то других автоматизированных систем. Очень надеюсь, что кто-то заинтересуется и откликнется, иначе у меня останется только очень не нравящийся мне самому вариант со всяким бредом из области SEO: вроде продажи ссылок на биржах, размещении чужих статей и тому подобного... Либо вообще отказываться от затеи с монетизацией блога и возвращаться к поиском &laquo;офисной&raquo; работы, но вообще мне очень не хотелось бы снова забрасывать <strong>Insight IT</strong>, одно из самых любимых хобби как-никак.</p>
<p>Основные темы блога мне по-прежнему очень интересны: как информационные технологии в целом, так и <a href="/highload">архитектуры высоконагруженных систем</a> в частности. Мне наверное еще предстоит поэкспериментировать с различными форматами изложения информации, более узкими темами и вопросами, чтобы подстроиться под наверняка изменившиеся за прошедший год интересы аудитории блога, я по прежнему рад комментариям, письмам на wordpress@insight-it.ru и другим видам обратной связи. По старинке хочется порекомендовать всем, кто этого еще не сделал, <a href="/feed" target="_blank"><em>подписаться на RSS</em></a>.</p>
<p>До новых встреч!</p>
<div class="feedflare">
<a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=n3hEEXCMh9w:JGi8w5DF338:yIl2AUoC8zA"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?d=yIl2AUoC8zA" border="0"></img></a> <a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=n3hEEXCMh9w:JGi8w5DF338:F7zBnMyn0Lo"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?i=n3hEEXCMh9w:JGi8w5DF338:F7zBnMyn0Lo" border="0"></img></a> <a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=n3hEEXCMh9w:JGi8w5DF338:V_sGLiPBpWU"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?i=n3hEEXCMh9w:JGi8w5DF338:V_sGLiPBpWU" border="0"></img></a>
</div><img src="http://feeds.feedburner.com/~r/insight-it/feed/~4/n3hEEXCMh9w" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/life/wordpress/nam-dva-godika/feed/</wfw:commentRss>
		<slash:comments>12</slash:comments>
		<feedburner:origLink>http://www.insight-it.ru/life/wordpress/nam-dva-godika/</feedburner:origLink></item>
		<item>
		<title>Новый Google: интернет-гигант проливает свет на темы поиска в реальном времени, локального поиска, облачных вычислений и освобождения данных</title>
		<link>http://feedproxy.google.com/~r/insight-it/feed/~3/mhDQ63rKwJk/</link>
		<comments>http://www.insight-it.ru/set/novyjj-google-internet-gigant-prolivaet-svet-na-temy-poiska-v-realnom-vremeni-lokalnogo-poiska-oblachnykh-vychislenijj-i-osvobozhdeniya-dannykh/#comments</comments>
		<pubDate>Tue, 29 Dec 2009 15:17:27 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Сеть]]></category>
		<category><![CDATA[cloud computing]]></category>
		<category><![CDATA[data liberation]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[local search]]></category>
		<category><![CDATA[online]]></category>
		<category><![CDATA[realtime search]]></category>
		<category><![CDATA[интервью]]></category>
		<category><![CDATA[интернет]]></category>
		<category><![CDATA[облачные вычисления]]></category>
		<category><![CDATA[освобождение данных]]></category>
		<category><![CDATA[поиск]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=385</guid>
		<description><![CDATA[Когда речь заходит о продуктовых и бизнес стратегиях, Google обычно становится одной из самых скрытных и секретных компаний. Но не смотря на это, интернет-гигант некоторое время назад согласился дать серию интервью, в основном с участием высшего продуктового менеджмета, работающего в штабквартире в Mountain View, CA.
В четырех отдельных интервью, сотрудники Google окунулись в самые насущные темы, [...]]]></description>
			<content:encoded><![CDATA[
<p><a href="http://feedads.g.doubleclick.net/~a/99szawrfyWH9U7g7LUf0E89qcu0/0/da"><img src="http://feedads.g.doubleclick.net/~a/99szawrfyWH9U7g7LUf0E89qcu0/0/di" border="0" ismap="true"></img></a><br/>
<a href="http://feedads.g.doubleclick.net/~a/99szawrfyWH9U7g7LUf0E89qcu0/1/da"><img src="http://feedads.g.doubleclick.net/~a/99szawrfyWH9U7g7LUf0E89qcu0/1/di" border="0" ismap="true"></img></a></p><p>Когда речь заходит о продуктовых и бизнес стратегиях, Google обычно становится одной из самых скрытных и секретных компаний. Но не смотря на это, интернет-гигант некоторое время назад согласился дать серию интервью, в основном с участием высшего продуктового менеджмета, работающего в штабквартире в Mountain View, CA.</p>
<p>В четырех отдельных интервью, сотрудники Google окунулись в самые насущные темы, наиболее актуальные для компании в целом. Среди них оказались различные вопросы, начиная с поиска в реальном времени, локального поиска, и заканчивая облачными вычислениями, а также так называемой возможностью освобождения данных. Под освобождением данных имеется ввиду комплекс мер, направленных на предоставлении пользователям возможности экспортировать их файлы и другую цифровую информацию из продуктов Google (если они сами этого захотят, конечно же).</p>
<p>Достаточно любопытный факт: менеджеры Google реально очень скучные. И им правда нравится выглядеть именно так (по крайней мере пока их PR-коллеги находятся рядом). Они не разговаривают о конкурентах. Они не делают прогнозов о развитии индустрии. И они не говорят конкретно кто над чем работает внутри Google. Просто-напросто они фокусируются на совершенствовании своих продуктов, особенно в направлении удобства использования пользователями, разве этого не достаточно?</p>
<p>Возможно Jack Menzel, старший продукт-менеджер, лучше всего это выразил, когда пошутил о &laquo;неблагодарности&raquo; работы над веб-поиском в Google: &laquo;Вы демонстрируете [новую функцию поиска] людям, а они говорят: &#39;Да, вроде она работает, ну и что?&#39;&raquo; (Как быстро все мы забываем, каково это было искать информацию в Интернете всего несколько лет назад.) Что ж, без дальнейших предисловий, перейдем к основным моментам, связанным с различными аспектами работы Google.</p>
<p><span id="more-385"></span> <em>По мотивам <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.xconomy.com/national/2009/12/21/the-new-google-internet-giant-opens-up-about-real-time-and-local-search-cloud-computing-and-data-liberation/?single_page=true"  target="_blank" rel="external nofollow">статьи на xconomy.com</a></noindex>, автор <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.xconomy.com/author/ghuang/" title="Posts by Gregory T. Huang"  target="_blank" rel="external nofollow">Gregory T. Huang</a></noindex>.</em></p>
<h2>Поиск в реальном времени</h2>
<p>Google активно работает над максимально оперативным обновлением результатов поиска по сети Интернет, в том числе и по социальным медиа вроде Twitter или Facebook, практически так же быстро, как такая информация и публикуется.</p>
<p>Menzel, бывший сотрудник Microsoft, который изучал компьютерное ремесло в University of Washington, возглавляет продуктовую группу на данном фронте. Он говорит, что компания Google работала над ускорением процесса индексации и ранжирования на протяжении уже многих лет: когда-то данные обновлялись раз в месяц, потом обновление стало ежедневным, чтобы поспевать за блогами и новостными сайтами. В течении прошлого года <a href="/tag/twitter" target="_blank">Twitter</a> стал популярен и, как следствие, появилась достаточно критичная потребность в обновлении информации за считанные секунды или в крайнем случае минуты. &laquo;Мы двигались по направлению к тому, чтобы становиться все быстрее и быстрее, на протяжении уже достаточно длительного периода времени&raquo;, говорит Menzel. &laquo;Данная траектория развития была выбрана уже давно. Каждый шаг в данном направлении приводит к все новым и новым проблемам и трудностям. Мы верим, что именно получение доступа к свежей информации является одним из ключевых факторов, являющихся залогом успеха Google.&raquo; (В число остальных факторов, относящихся к самому поиску, входят такие показатели как релевантность, быстрота получения результата и полнота контента.)</p>
<p>Menzel считает, что самой сложной задачей является не просто быстродействие, а релевантность результатов потребностям пользователей (возможно, кто-то привык называть этот показатель словом <em>&laquo;пертинентность&raquo;</em>). &laquo;Это очень, очень непросто собирать свежий короткоживущий контент и ранжировать его рядом с, скажем, статьями из New York Times или просто постами из блогов.&raquo; Стоит заметить, что когда контент появился буквально только что, обычно на него еще практически никто не успел сослаться, а значит Google не может полноценно использовать PageRank, их классическую технологию.</p>
<p>Вместо этого, они &laquo;тяжело опираются на все то, что они выявили в течении последних 10 лет&raquo;, говорит Menzel. Это включает в себя, например, способы отбрасывания контента, который скорее всего является иррелевантным или спамом, в более общем случае.  Помимо этого он упоминал &laquo;совершенно новые сигналы&raquo;, скажем &laquo;новые языковые модели&raquo;, которые позволяют понять какие обновления являются релевантыми, а какие&nbsp;&mdash; просто горстка никому не нужных данных от какого-нибудь ученого-океанографа, или методы определения насколько тот или иной создатель контента авторитетен в своей области.</p>
<p>Говоря о будущем, Menzel повторил то, что казалось бы на сегодняшний день говорят все о поиске: еще рано. &laquo;На самом деле мы лишь начали работать над данной задачей и у нас все еще очень долгий путь впереди&raquo;. Он надеется, что в течении 5 лет Google сделает поиск намного более персонализированным, чем он есть сегодня. Например, Google будет знать что ты увлекаешься футболом, но привык называть его не &laquo;soccer&raquo;, а &laquo;football&raquo;, то есть помимо прочего поисковая система должна понимать кем является каждый ее конкретный пользователь, как и с кем он связан, кем он является в реальной жизни, где находится, и, тем самым, помогать ему организовывать всю информацию вокруг него.</p>
<p>&laquo;Поиск&nbsp;&mdash; все еще очень далекая от решения проблема,&raquo;&nbsp;&mdash; говорит Menzel.  "Существует еще масса вещей, которые очень не просто найти в Интернете."</p>
<h2>Локальный поиск</h2>
<p>В эту категорию попадают все виды поисковых запросов, так или иначе связынных с географической информацией, скажем &laquo;отели в Гонг-Конге&raquo; или &laquo;рестораны в Сиэттле&raquo;, а также запросы с мобильных устройств на поиск близлежайших мест, заведений, достопримечательностей и прочих объектов.</p>
<p>Carter Maslan, директор продуктового менеджмента в области локального поиска в Google, называет эту область &laquo;организацией мировой информации географически&raquo; , или созданием быстрого и простого гида по &laquo;гео-Интернету&raquo;. Самым сложным моментом в данном вопросе по его мнению является отображение всех этих различных способов выражения пользовательского запроса на очень большой массив локализированных данных, а также возвращение правильного ответа на полученный запрос в минимальные сроки.</p>
<p>Maslan, еще один экс-сотрудник Microsoft, говорит, что Google обрабатывает большое количество поисковых запросов для анализа того, как люди предпочитают искать локальную информацию, и как с географической точки зрения создаются ссылки на различные вещи. По его мнению конечная цель заключается в том, чтобы сделать поиск и обнаружение мест рядом с собой практически не требующим от пользователя каких-либо усилий. Наиболее знакомые сценарии, это помощь в ориентировании в новом окружении, скажем после приземления в аэропорту, или поиск баров во время ночной прогулки по пригородам Нью-Йорка.</p>
<p>Складывается впечатление, что все это должно плотно вписываться в более широкую стратегию Google, связанную с мобильными технологиями. &laquo;Ваш телефон знает многое&raquo;  - говорит Maslan. &laquo;Он знает где Вы сейчас находитесь, он может определить в каком направлении Вы направляетесь. Все не ограничивается только текстом в окошке для поискового запроса. Мы хотим вывести мобильную информацию на передний план.&raquo; Существующим на данный момент примером является <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.google.com/mobile/goggles/"  target="_blank" rel="external nofollow">Google Goggles</a></noindex>, приложение, которое позволяет сфотографировать логотип, достопримечательность или какое-то место и мгновенно получить информацию о нем.</p>
<p>Maslan считает, что основной отличительной чертой Google в области локального поиска является &laquo;открытость для всех источников&raquo;, что достаточно сложно с технической точки зрения. Это включает в себя пребывание в состоянии &laquo;активной глобальности&raquo;, а не просто в индексировании информации о ключевых станциях метро. &laquo;Масштаб, с которым Google работает с картографическими и гео-кодированными данными, в совокупности с пониманием принципов работы Интернета является ключем для успешной работы в данной области&raquo;.</p>
<p>Возможно в скором будущем мы увидим вещи вроде карт и списков компаний или мест от Google в еще большем количестве мест и языков по всему миру, с еще более точной информацией, чутко реагирующей на локальные события вроде открытия, закрытия или перемещения предприятий и организаций. &laquo;Мы четко понимаем, какие именно вещи у нас получаются лучше всего&raquo;&nbsp;&mdash; говорит Maslan. &laquo;У нас есть небольшие команды из людей, фанатично настроенных на реализацию их наиболее правильным образом&raquo;.</p>
<h2>Облачные вычисления</h2>
<p>Наверняка все наслышаны о знаменитых вычислениях &laquo;в облаках&raquo;, то есть с использованием программного обеспечения, работающем на удаленных серверах, часто нескольких одновременно и в виртуализированном окружении, а не прямо на персональном компьютере. В этом ключе Google наиболее интересует выполнение повседневных задач, таких как работа с электронной почтой, составление расписаний и управление документами. На самом деле это всего лишь часть более широкой стратегии Google по облачным вычисления&nbsp;&mdash; именно она создает видимость того, что потребитили, предприятия и организации арендуют вычислительный мощности и хранилища данных через Интернет, так как это дешевле и более эффективно для многих приложений.</p>
<p>Ken Norton, старший продукт-менеджер Google (а также выпускник Boston University и бывший предприниматель), поведал о Google Apps и стратегии компании в области облачных вычислений. Команда Norton&#39;а работает конкретно над Google Calendar, но Google Apps также включают в себя и другие продукты, такие как Gmail, Google Talk, Google Docs и Google Sites. “Сеть выигрывает на том, как приложения будут потребляться”&nbsp;&mdash; он сказал.</p>
<p>Ключевым преимуществом Google на данном фронте является масштаб и инфраструктура. &laquo;У нас есть настолько много серверов и датацентров по всему миру, что мы можем содержать их достаточно дешево и эффективно&raquo;&nbsp;&mdash; говорит Norton. Это преимущество оказывает влияние и на индивидуальные устройства, так как оно &laquo;открывает новые возможности&raquo; для потребителей, возможность использовать веб-приложения с любого типа устройств, будь то смартфон, нетбук или обычный полноразмерный ноутбук.</p>
<p>Работа Google в области облачных вычислений сфокусирована на двух уровнях: на первом располагаются готовые программные продукты вроде Google Apps, направленные на прямое потребление конечными пользователями (как индивидуальными, так и корпоративными); второй же уровень занимает App Engine, &laquo;облачная&raquo; платформа, предназначенная для использования разработчиками программного обеспечения для эффективного построения их собственных веб-продуктов.</p>
<p>Относительно прогнозов на следующий год на фронте облачных вычислений, Norton сказал, что &laquo;мы постоянно совершенствуемся&raquo;. В 2009 году было запущенно более 100 основных новых функциональных возможностей в Google Apps&nbsp;&mdash; таких вещей, как видео чат в GTalk или Gmail offline. Он считает, что Google &laquo;продолжит делать акцент на коммуникационных предложениях&raquo;. Помимо развития Gmail и Calendar, это включает в себя доведение до ума Google Docs и придание более завершенного вида набору их возможностей. Norton говорит, что Google также ищет возможности по расширению своих предложений в области коллаборации, в том числе в виде продуктов для крупного бизнеса, совместимыми с различными системами обеспечения безопасности для аутентификации.</p>
<p>Подведем черту: все выглядит как-будто Google совершает переход от фокусирования на бесплатных потребительских продуктах, работающих в &laquo;облаках&raquo;, к более активной работе над платными облачными сервисами для бизнес-пользователей.</p>
<h2>Освобождение данных</h2>
<p>Последнее время в компании все больше внимания уделяется предоставлению пользователям легко экспортировать их данные из продуктов Google, таких как Blogger, Google Maps, Google Docs, Chrome и App Engine (пользовательские данные разработчиков). На первый взгляд это может показаться очередным капризом PR-менеджеров, но на самом деле за этим фактом стоит более глубокая и интересная инновационная стратегия.</p>
<p>Brian Fitzpatrick, ветеран opensource разработок, возглавляет двухлетний проект от офисов Google в Чикаго. Основная идея заключается в оказании помощи пользователям, если они хотят получить свои файлы и другие данные из облака Google, чтобы у них была возможность перейти на какую-то другую систему, если они захотят. &laquo;Большинство людей не думает о возможности экспорта данных до тех пор пока не станет слишком поздно&raquo;&nbsp;&mdash; говорит Fitzpatrick. &laquo;Мы надеемся, что если вы прекратите использование одного нашего продукта сегодня, то у вас будет возможность попробовать другой продукт завтра.&raquo;</p>
<p>Помимо &laquo;создания правильных возможностей для пользователей&raquo; существует и другая мотивация. &laquo;Мы, как компания, старательно работаем над такими вещами, как поиск. Если пользователи становятся привязанным к вашим продуктам, то вы становитесь более самодовольными, расслабленными. Если же уйти достаточно просто, то вы будете серьезно мотивированны делать свои продукты как можно лучше, чтобы избежать ухода пользователей любой ценой.&raquo;</p>
<p>Что ж, теперь у нас есть эта возможность. Google считает, что эта открытость с точки зрения пользовательских данных, заставит компанию работать более старательно для удержания пользовательской базы. Fitzpatrick не знает других компаний, которые бы открыто заявляли об инициативе создания подобных возможностей для своих пользователей.</p>
<p>По его мнению наибольшая трудность лежит не собственно в разработке такого функционала, а в повышение осведомленности пользователей о наличии возможности экспортировать свои данные из облака. &laquo;Достаточно сложно заставить пользователей думать, что это на самом деле важно&raquo;. Но в целом этот подход достаточно достаточно хорошо вписывается в понятие о том, как потребители и корпоративные пользователи заботятся о всех своих данных, когда все большая и большая их част мигрирует &laquo;в облака&raquo; и как Google хочет быть ответственным за организацию мировых данным, шаг за шагом, на протяжении всего пути.</p>
<div class="feedflare">
<a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=mhDQ63rKwJk:4WlKuZ1G1Oc:yIl2AUoC8zA"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?d=yIl2AUoC8zA" border="0"></img></a> <a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=mhDQ63rKwJk:4WlKuZ1G1Oc:F7zBnMyn0Lo"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?i=mhDQ63rKwJk:4WlKuZ1G1Oc:F7zBnMyn0Lo" border="0"></img></a> <a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=mhDQ63rKwJk:4WlKuZ1G1Oc:V_sGLiPBpWU"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?i=mhDQ63rKwJk:4WlKuZ1G1Oc:V_sGLiPBpWU" border="0"></img></a>
</div><img src="http://feeds.feedburner.com/~r/insight-it/feed/~4/mhDQ63rKwJk" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/set/novyjj-google-internet-gigant-prolivaet-svet-na-temy-poiska-v-realnom-vremeni-lokalnogo-poiska-oblachnykh-vychislenijj-i-osvobozhdeniya-dannykh/feed/</wfw:commentRss>
		<slash:comments>6</slash:comments>
		<feedburner:origLink>http://www.insight-it.ru/set/novyjj-google-internet-gigant-prolivaet-svet-na-temy-poiska-v-realnom-vremeni-lokalnogo-poiska-oblachnykh-vychislenijj-i-osvobozhdeniya-dannykh/</feedburner:origLink></item>
		<item>
		<title>Дизайн, верстка и RSS</title>
		<link>http://feedproxy.google.com/~r/insight-it/feed/~3/sVzEVnL2gHA/</link>
		<comments>http://www.insight-it.ru/life/wordpress/dizajjn-verstka-i-rss/#comments</comments>
		<pubDate>Mon, 28 Dec 2009 17:44:03 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[WordPress]]></category>
		<category><![CDATA[feedback]]></category>
		<category><![CDATA[online]]></category>
		<category><![CDATA[RSS]]></category>
		<category><![CDATA[верстка]]></category>
		<category><![CDATA[внешний вид]]></category>
		<category><![CDATA[дизайн]]></category>
		<category><![CDATA[опрос]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=390</guid>
		<description><![CDATA[Я лично считаю, что очень важно после каких-либо кардинальных изменений сайта получить feedback от пользователей. Данный пост служит именно для этих целей.
Для затравки пара опросов:
В добавок хочется услышать отзывы об этих и других нововведениях (вроде нового хостинга) в комментариях.
Еще буду рад, если кто-то предложит какие-нибудь интересные и востребованные темы для новых постов и обсуждений, у [...]]]></description>
			<content:encoded><![CDATA[
<p><a href="http://feedads.g.doubleclick.net/~a/CfgYtgGc8kpjmR60vwJfAr4mI-g/0/da"><img src="http://feedads.g.doubleclick.net/~a/CfgYtgGc8kpjmR60vwJfAr4mI-g/0/di" border="0" ismap="true"></img></a><br/>
<a href="http://feedads.g.doubleclick.net/~a/CfgYtgGc8kpjmR60vwJfAr4mI-g/1/da"><img src="http://feedads.g.doubleclick.net/~a/CfgYtgGc8kpjmR60vwJfAr4mI-g/1/di" border="0" ismap="true"></img></a></p><p>Я лично считаю, что очень важно после каких-либо кардинальных изменений сайта получить feedback от пользователей. Данный пост служит именно для этих целей.<span id="more-390"></span></p>
<p>Для затравки пара опросов:</p>
Примечание: когда опрос включен в запись, пожалуйста<br />
Примечание: когда опрос включен в запись, пожалуйста
<p>В добавок хочется услышать отзывы об этих и других нововведениях (вроде нового хостинга) в комментариях.</p>
<p>Еще буду рад, если кто-то предложит какие-нибудь интересные и востребованные темы для новых постов и обсуждений, у меня есть и свои соображения, но мнение читателей для меня тоже очень важно.</p>
<p>Всем, проявившим инициативу, заранее спасибо за помощь в улучшении блога <strong>Insight IT</strong>.</p>
<div class="feedflare">
<a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=sVzEVnL2gHA:NnXSUH3lhzo:yIl2AUoC8zA"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?d=yIl2AUoC8zA" border="0"></img></a> <a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=sVzEVnL2gHA:NnXSUH3lhzo:F7zBnMyn0Lo"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?i=sVzEVnL2gHA:NnXSUH3lhzo:F7zBnMyn0Lo" border="0"></img></a> <a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=sVzEVnL2gHA:NnXSUH3lhzo:V_sGLiPBpWU"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?i=sVzEVnL2gHA:NnXSUH3lhzo:V_sGLiPBpWU" border="0"></img></a>
</div><img src="http://feeds.feedburner.com/~r/insight-it/feed/~4/sVzEVnL2gHA" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/life/wordpress/dizajjn-verstka-i-rss/feed/</wfw:commentRss>
		<slash:comments>14</slash:comments>
		<feedburner:origLink>http://www.insight-it.ru/life/wordpress/dizajjn-verstka-i-rss/</feedburner:origLink></item>
		<item>
		<title>Архитектура MySpace</title>
		<link>http://feedproxy.google.com/~r/insight-it/feed/~3/rbP4fPZJP5U/</link>
		<comments>http://www.insight-it.ru/masshtabiruemost/arkhitektura-myspace/#comments</comments>
		<pubDate>Mon, 21 Dec 2009 13:15:56 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[Масштабируемость]]></category>
		<category><![CDATA[ASP]]></category>
		<category><![CDATA[ASP .NET]]></category>
		<category><![CDATA[highload]]></category>
		<category><![CDATA[IIS]]></category>
		<category><![CDATA[Microsoft]]></category>
		<category><![CDATA[MSSQL]]></category>
		<category><![CDATA[MySpace]]></category>
		<category><![CDATA[myspace.com]]></category>
		<category><![CDATA[online]]></category>
		<category><![CDATA[Windows]]></category>
		<category><![CDATA[Windows Server]]></category>
		<category><![CDATA[архитектура]]></category>
		<category><![CDATA[архитектура MySpace]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=370</guid>
		<description><![CDATA[MySpace.com является одним из наиболее быстро набирающих популярность сайтов в Интернете с 65 миллионами пользователей и 260000 регистрациями в день. Этот сайт часто подвергается критике из-за не достаточной производительности, хотя на самом деле MySpace удалось избежать ряда проблем с масштабируемостью, с которыми большинство других сайтов неизбежно сталкивались. Как же им это удалось?

Источники информации
Данная статья является [...]]]></description>
			<content:encoded><![CDATA[
<p><a href="http://feedads.g.doubleclick.net/~a/K0Cj-DpIo18gJ1hX_3CdTICKPs4/0/da"><img src="http://feedads.g.doubleclick.net/~a/K0Cj-DpIo18gJ1hX_3CdTICKPs4/0/di" border="0" ismap="true"></img></a><br/>
<a href="http://feedads.g.doubleclick.net/~a/K0Cj-DpIo18gJ1hX_3CdTICKPs4/1/da"><img src="http://feedads.g.doubleclick.net/~a/K0Cj-DpIo18gJ1hX_3CdTICKPs4/1/di" border="0" ismap="true"></img></a></p><p><noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.myspace.com" rel="external nofollow"  target="_blank">MySpace.com</a></noindex> является одним из наиболее быстро набирающих популярность сайтов в Интернете с 65 миллионами пользователей и 260000 регистрациями в день. Этот сайт часто подвергается критике из-за не достаточной производительности, хотя на самом деле MySpace удалось избежать ряда проблем с масштабируемостью, с которыми большинство других сайтов неизбежно сталкивались. Как же им это удалось?<br />
<span id="more-370"></span></p>
<h2>Источники информации</h2>
<p><em>Данная статья является переводом статьи <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://highscalability.com/blog/2009/2/12/myspace-architecture.html" rel="external nofollow"  target="_blank">MySpace Architecture</a></noindex>, автором которой является Todd Hoff. Когда-то давно один из читателей этого блога просил меня осветить и эту тему, тогда я так и не решился из-за отсутствия моего личного интереса, но сейчас снова случайно наткнулся на эту статью и подумал: а почему бы и нет?</em></p>
<ul>
<li><noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.infoq.com/news/2009/02/MySpace-Dan-Farino" rel="external nofollow"  target="_blank">Презентация: за сценой MySpace.com</a></noindex></li>
<li><noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.baselinemag.com/c/a/Projects-Networks-and-Storage/Inside-MySpacecom/" rel="external nofollow"  target="_blank">Внутри MySpace.com</a></noindex></li>
</ul>
<h2>Платформа</h2>
<ul>
<li>ASP .NET 2.0</li>
<li>Windows</li>
<li>IIS</li>
<li>MSSQL Server</li>
</ul>
<h2>Что внутри?</h2>
<ul>
<li>300 миллионов пользователей.</li>
<li>Отдает 100Gbps в Интернет. 10Gbps из них является HTML контентом.</li>
<li>4,500+ веб серверов со связкой: Windows 2003 / IIS 6.0 / ASP .NET.</li>
<li>1,200+ кэширующих серверов, работающих на 64-bit Windows 2003. На каждом 16GB объектов находятся в кэше в оперативной памяти.</li>
<li>500+ серверов баз данных, работающих на 64-bit Windows и SQL Server 2005.</li>
<li>MySpace обрабатывает 1.5 миллиарда просмотров страниц в день, а также 2.3 миллионов одновременно работающих пользователей в течении дня.</li>
<li>Вехи по количеству пользователей:<br />
&mdash; 500 тысяч пользователей: простая архитектура перестает справляться<br />
&mdash; 1 миллион пользователей: вертикальное партиционирование временно спасает от основных болезненных вопросов с масштабированием<br />
&mdash; 3 миллиона пользователей: горизонтальное масштабирование побеждает над вертикальным<br />
&mdash; 9 миллионов пользователей: сайт мигрирует на ASP.NET, создается виртуализированная система хранения данных (SAN)<br />
&mdash; 26 миллионов пользователей: MySpace переходит на 64-битную технологию.</li>
<li>500 тысяч учетных записей было многовато для двух веб-серверов и одного сервера баз данных.</li>
<li>На 1-2 миллионах учетных записей:<br />
&mdash; Они использовали архитектуру базы данных, построенную на концепции вертикального партиционирования, с отдельными базами данных для разных частей сайта, которые использовались для выполнения различных функций, таких как экран авторизации, профили пользователей и блоги.<br />
&mdash; Схема с вертикальным партиционированием помогала разделить нагрузку как для операций чтения, так и для операций записи, а если пользователям в друг оказывалась нужна новая функциональная возможность&nbsp;&mdash; достаточно было просто добавить еще один сервер баз данных для её обслуживания.<br />
&mdash; MySpace переходит от использования систем хранения, подключенных к серверам баз данных напрямую, к сетям хранения данных (SAN), при таком подходе целый массив систем хранения объединяется вместе специализированной сетью с высокой пропускной способностью, и сервера баз данных также получают доступ к хранилищам через эту сеть. Переход к SAN оказал положительное влияние как на производительность, так и на доступность и надежность системы.</li>
<li>На 3 миллионах учетных записей:<br />
&mdash; Решение с вертикальным партиционированием не протянуло долго, так как им приходилось реплицировать какую-то часть информации (например информацию об учетных записях) по всем вертикальным частям базы данных. С таким большим количеством операций репликации данных один узел даже при незначительном сбое мог существенно замедлить обновление информации во всей системе.<br />
&mdash; Индивидуальные приложения вроде блогов на под-секциях сайта достаточно быстро стали слишком большими для нормальной работы с единственным сервером базы данных<br />
&mdash; Произведена реорганизация всех ключевых данных для более логичной организации в единственную базу данных<br />
&mdash; Пользователи были разбиты на группы по миллиону в каждой и каждая такая группа была перемещена на отдельный SQL Server</li>
<li>9–17 миллионов учетных записей:<br />
&mdash; Переход на ASP .NET, который требовал меньше ресурсов по сравнению с их предыдущим вариантом архитектуры. 150 серверов, использовавших новый код могли обработать нагрузку, для которой раньше требовалось 246 серверов.<br />
&mdash; Снова пришлось столкнуться с узким местом в системе хранения данных. Реализация SAN решило какую-то часть старых проблем с производительностью, но на тот момент потребности сайта начали переодически превосходить возможности SAN по пропускной способности операций ввода-вывода&nbsp;&mdash; той скорости, с которой она может читать и писать данные на дисковые массивы.<br />
&mdash; Столкнулись с лимитом производительности при размещении миллиона учетных записей на одном сервере, ресурсы некоторых серверов начали исчерпываться.<br />
&mdash; Переход к виртуальному хранилищу, где весь SAN рассматривается как одно большое общее место для хранения данных, без необходимости назначать конкретные диски для хранения данных определенной части приложения. MySpace на данный момент работает со стандартизированным обородуванием от достаточно нового вендора SAN&nbsp;&mdash; 3PARdata</li>
<li>Был добавлен кэширующий уровень — прослойка из специализированных серверов, расположенных между веб-серверами и серверами данных, чья единственная задача была захватывать копии часто запрашиваемых объектов с данными в памяти и отдавать их веб-серверам для минимизации количества поиска данных в СУБД.</li>
<li>26 миллионов учетных записей:<br />
&mdash; Переход на 64-битные сервера с SQL Server на правах решения проблемы с недостатком оперативной памяти. С тех пор их стандартеый сервер баз данных оснащен 64 GB RAM.</li>
<li><strong>Горизонтальная федерация баз данных</strong>. Базы данных партиционируются в зависимости от своего назначения. У них есть базы данных с профилями, электронными сообщениями и так далее. Каждая партиция основана на диапазоне пользоваталей. По миллиону в каждой базе данных. Таким образом,  у них есть Profile1, Profile2 и все остальные базы данных вплоть до Profile300, если считать, что у них на данный момент зарегистрировано 300 миллионов учетных записей.</li>
<li>Кэш ASP не используется, так как он не обеспечивает достаточного процента попаданий на веб серверах. Кэш, организованный как промежуточный слой, имеет существенно более высокое значение данного показателя.</li>
<li><strong>Изоляция сбоев</strong>. Внутри веб-сервера запросы сегментируются по базам данным. Разрешено использование только 7 потоков для работы с каждуой базой данных. Таким образом, если база данных по каким-то причинам начинает работать медленно, только эти потоки замедлятся, в то время как остальные потоки будут успешно продолжать обрабатывать поток трафика.</li>
</ul>
<h2>Работа сайта</h2>
<ul>
<li><strong>Коллектор данных о производительности</strong>. Централизованная система сбора информации о производительности через UDP. Такой подход более надежен, чем стандартный механизм Windows, а также позволяет любому клиенту подключиться и увидеть статистику.</li>
<li><strong>Веб-система по просмотру дампов стеков процессов</strong>. Можно просто сделать клик правой кнопкой мыши на проблемном сервере и увидеть дамп стека процесов, управляемых .NET. И это после привычки каждой раз удаленно подключаться к серверу, влючать дебаггер и через полчаса получать свой ответ о том что же все таки происходит. Медленно, немасштабируемо и утомительно. Эта же система позволяет увидеть не просто стек процесса, но и предоставляет большое количество информации о контектсе, в котором он работает. Обнаружение проблем намного проще при таком подходе, например можно легко увидеть, что база не отвечает, так как 90 ее потоков заблокировано.</li>
<li><strong>Веб-система создания дампа heap-памяти</strong>. Создает дамп всей выделенной памяти. Очень удобно и полезно для разработчиков. Сэкономьте часы на выполнение этой работы вручную.</li>
<li><strong>Профайлер</strong>. Прослеживает запрос от начала до конца и выводит подробный отчет. В нем можно увидеть URL, методы, статус, а также все, что поможет идентифицировать медленный запрос и его причины. Обнаруживает проблемы с блокировкой потоков, непредвиденными исключениями, другими словами все, что может оказаться интересным. В то же время остается очень легковесным решением. Работает на одной машине из каждой VIP (группа из 100 серверов) в production-среде. Опрашивает 1 поток каждые 10 секунд. Постоянно следит за системой в фоновом режиме.</li>
<li><strong>Powershell</strong>. Новая программная оболочка от Microsoft, которая работает в процессе и передаем объекты между командами вместо работы с текстовыми данными. MySpace разрабатывает множество так называемых commandlets&#39;ов для поддержки различных операций.</li>
<li>Разработана собственная технология асинхронной коммуникации для того, чтобы обойти проблемы с сетевыми проблемами Windows и работать с серверами как с группой. Например, она позволяет доставить файл .cs, скомпилировать его, запустить, и доставить результат обратно.</li>
<li><strong>Развертывание</strong>. Обновление кодовой базы происходит с помощью упомянутой выше собственной технологии. Ранее происходило до 5 таких обновлений в день, сейчас же они происходят лишь раз в неделю.</li>
</ul>
<h2>Подводим итоги</h2>
<ul>
<li>С помощью стека Microsoft тоже можно делать большие веб-сайты.</li>
<li>Стоит использовать кэширование с самого начала.</li>
<li>Кэш является более подходящим местом для хранения временных данных, не требующих персистентности, например информации о пользовательских сессиях.</li>
<li>Встроенные в операционные систему возможности, например по обнаружению DDoS-атака, могут приводить к необъяснимым сбоям.</li>
<li>Храните свои данные в географически удаленных датацентрах для минимизации проблем, связанных со сбоями в электросети.</li>
<li>Рассматривайте возможности использования виртуализированных систем хранения данных или кластерных файловых систем с самого начала. Это позволит существенно параллелизировать операции ввода-вывода, а также увеличивать дисковое пространство без необходимости какой-либо реорганизации.</li>
<li>Разрабатывайте утилиты для работы с production окружением. Невозможно смоделировать все ситуации в тестовой среде. Масштабируемость и все различные варианты использования API не могут быть симулированы в процессе тестирования качества программного обеспечения.  Обычные пользователи и хакеры обязательно найдут такие способы использования вашего продукта, о которых вы даже никогда и не подумаете в процессе тестирования, хотя конечно большая часть все же обнаружима в процессе QA тестирования.</li>
<li>Когда это возможно&nbsp;&mdash; лучше просто использовать дополнительное оборудование для решения проблем. Это намного проще, чем изменять поведение программного обеспечения для того чтобы решать задачи как-то по-другому. Примером может служить добавление нового сервера на каждый миллион пользователей. Возможно было бы более эффективным изменить подход к самой работе с СУБД, но на практике все же проще и дешевле добавлять все новые и новые сервера. По крайней мере на данный момент.</li>
</ul>
<div class="feedflare">
<a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=rbP4fPZJP5U:XO7nE0rweRM:yIl2AUoC8zA"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?d=yIl2AUoC8zA" border="0"></img></a> <a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=rbP4fPZJP5U:XO7nE0rweRM:F7zBnMyn0Lo"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?i=rbP4fPZJP5U:XO7nE0rweRM:F7zBnMyn0Lo" border="0"></img></a> <a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=rbP4fPZJP5U:XO7nE0rweRM:V_sGLiPBpWU"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?i=rbP4fPZJP5U:XO7nE0rweRM:V_sGLiPBpWU" border="0"></img></a>
</div><img src="http://feeds.feedburner.com/~r/insight-it/feed/~4/rbP4fPZJP5U" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/masshtabiruemost/arkhitektura-myspace/feed/</wfw:commentRss>
		<slash:comments>9</slash:comments>
		<feedburner:origLink>http://www.insight-it.ru/masshtabiruemost/arkhitektura-myspace/</feedburner:origLink></item>
		<item>
		<title>Переезд + реконструкция</title>
		<link>http://feedproxy.google.com/~r/insight-it/feed/~3/UnJcpvu9hHU/</link>
		<comments>http://www.insight-it.ru/life/wordpress/pereezd-rekonstrukciya/#comments</comments>
		<pubDate>Sun, 20 Dec 2009 18:39:56 +0000</pubDate>
		<dc:creator>Иван Блинков</dc:creator>
				<category><![CDATA[WordPress]]></category>
		<category><![CDATA[Google Chrome Frame]]></category>
		<category><![CDATA[html5]]></category>
		<category><![CDATA[USA]]></category>
		<category><![CDATA[США]]></category>

		<guid isPermaLink="false">http://www.insight-it.ru/?p=334</guid>
		<description><![CDATA[Уважаемые читатели, у меня для вас есть ряд замечательных новостей:

Блог переехал на новый хостинг, теперь живем в США
Блог по прежнему работает на WordPress, от идеи трансфера на GAE я отказался из-за нехватки сил и времени
Оформление было переверстано на HTML5, пока все еще далеко от идеала, возможно буду переделывать (пользователей IE и прочего антиквариата просьба не [...]]]></description>
			<content:encoded><![CDATA[
<p><a href="http://feedads.g.doubleclick.net/~a/GHlP9ZlYTsMw96QXEPBBRYnGf8Y/0/da"><img src="http://feedads.g.doubleclick.net/~a/GHlP9ZlYTsMw96QXEPBBRYnGf8Y/0/di" border="0" ismap="true"></img></a><br/>
<a href="http://feedads.g.doubleclick.net/~a/GHlP9ZlYTsMw96QXEPBBRYnGf8Y/1/da"><img src="http://feedads.g.doubleclick.net/~a/GHlP9ZlYTsMw96QXEPBBRYnGf8Y/1/di" border="0" ismap="true"></img></a></p><p>Уважаемые читатели, у меня для вас есть ряд замечательных новостей:</p>
<ul>
<li>Блог переехал на новый хостинг, теперь <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://www.ip2location.com/66.147.244.182" rel="nofollow"  target="_blank">живем в США</a></noindex></li>
<li>Блог по прежнему работает на WordPress, от идеи трансфера на GAE я отказался из-за нехватки сил и времени</li>
<li>Оформление было переверстано на HTML5, пока все еще далеко от идеала, возможно буду переделывать (пользователей IE и прочего антиквариата просьба не кидаться камнями&nbsp;&mdash; сами виноваты)</li>
<li>Ради эксперимента добавлена поддержка <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://code.google.com/chrome/chromeframe/" rel="nofollow"  target="_blank">Google Chrome Frame</a></noindex></li>
<li>Все плагины и сам движок были обновлены и доведены до ума&nbsp;&mdash; раньше все работало на устаревших версиях</li>
<li>Я вспомнил, что у меня был аккаунт на твиттере:  <noindex><a target="_blank" rel="nofollow" href="http://www.insight-it.ru/goto/http://twitter.com/blinkov"  target="_blank">follow me</a></noindex>!</li>
<li>Решил попробовать вернуть AdSense в том виде, в котором он был когда-то давно, может быть на хлеб с маслом хватит, пока работу не найду <img src='http://www.insight-it.ru/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </li>
</ul>
<div class="feedflare">
<a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=UnJcpvu9hHU:A9U0OMrEkEo:yIl2AUoC8zA"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?d=yIl2AUoC8zA" border="0"></img></a> <a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=UnJcpvu9hHU:A9U0OMrEkEo:F7zBnMyn0Lo"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?i=UnJcpvu9hHU:A9U0OMrEkEo:F7zBnMyn0Lo" border="0"></img></a> <a href="http://feeds.feedburner.com/~ff/insight-it/feed?a=UnJcpvu9hHU:A9U0OMrEkEo:V_sGLiPBpWU"><img src="http://feeds.feedburner.com/~ff/insight-it/feed?i=UnJcpvu9hHU:A9U0OMrEkEo:V_sGLiPBpWU" border="0"></img></a>
</div><img src="http://feeds.feedburner.com/~r/insight-it/feed/~4/UnJcpvu9hHU" height="1" width="1"/>]]></content:encoded>
			<wfw:commentRss>http://www.insight-it.ru/life/wordpress/pereezd-rekonstrukciya/feed/</wfw:commentRss>
		<slash:comments>6</slash:comments>
		<feedburner:origLink>http://www.insight-it.ru/life/wordpress/pereezd-rekonstrukciya/</feedburner:origLink></item>
	</channel>
</rss><!-- Dynamic page generated in 2.790 seconds. --><!-- Cached page generated by WP-Super-Cache on 2010-03-14 16:29:20 -->
