amititash
diff --git a/‎amazonin/amazonin.py ‎amazonin.py b/‎amazonin/amazonin.py ‎amazonin.py
diff --git a/‎amazonin/amazonin.pyc ‎amazonin.pyc b/‎amazonin/amazonin.pyc ‎amazonin.pyc
diff --git a/‎anekdesign/anekdesigns_cushions.py ‎anekdesigns_cushions.py b/‎anekdesign/anekdesigns_cushions.py ‎anekdesigns_cushions.py
diff --git a/‎anekdesign/anekdesigns_cushions.pyc ‎anekdesigns_cushions.pyc b/‎anekdesign/anekdesigns_cushions.pyc ‎anekdesigns_cushions.pyc
diff --git a/‎anekdesign/anekdesigns_tablelinen.py ‎anekdesigns_tablelinen.py b/‎anekdesign/anekdesigns_tablelinen.py ‎anekdesigns_tablelinen.py
diff --git a/‎anekdesign/anekdesigns_tablelinen.pyc ‎anekdesigns_tablelinen.pyc b/‎anekdesign/anekdesigns_tablelinen.pyc ‎anekdesigns_tablelinen.pyc
diff --git a/‎anhad.py
+51 b/‎anhad.py
+51
diff --git a/‎anhad.pyc
2.34 KB b/‎anhad.pyc
2.34 KB
diff --git a/‎artconsult/arconsult.py ‎arconsult.py b/‎artconsult/arconsult.py ‎arconsult.py
diff --git a/‎artconsult/arconsult.pyc ‎arconsult.pyc b/‎artconsult/arconsult.pyc ‎arconsult.pyc
diff --git a/‎artisera/artisera_accents.py ‎artisera_accents.py b/‎artisera/artisera_accents.py ‎artisera_accents.py
diff --git a/‎artisera/artisera_accents.pyc ‎artisera_accents.pyc b/‎artisera/artisera_accents.pyc ‎artisera_accents.pyc
diff --git a/‎artisera/artisera_accessories.py ‎artisera_accessories.py b/‎artisera/artisera_accessories.py ‎artisera_accessories.py
diff --git a/‎artisera/artisera_accessories.pyc ‎artisera_accessories.pyc b/‎artisera/artisera_accessories.pyc ‎artisera_accessories.pyc
diff --git a/‎artisera/artisera_collectibles.py ‎artisera_collectibles.py b/‎artisera/artisera_collectibles.py ‎artisera_collectibles.py
diff --git a/‎artisera/artisera_collectibles.pyc ‎artisera_collectibles.pyc b/‎artisera/artisera_collectibles.pyc ‎artisera_collectibles.pyc
diff --git a/‎artisera/artisera_furniture.py ‎artisera_furniture.py b/‎artisera/artisera_furniture.py ‎artisera_furniture.py
diff --git a/‎artisera/artisera_furniture.pyc ‎artisera_furniture.pyc b/‎artisera/artisera_furniture.pyc ‎artisera_furniture.pyc
diff --git a/‎artisera/artisera_gifting.py ‎artisera_gifting.py b/‎artisera/artisera_gifting.py ‎artisera_gifting.py
diff --git a/‎artisera/artisera_gifting.pyc ‎artisera_gifting.pyc b/‎artisera/artisera_gifting.pyc ‎artisera_gifting.pyc
diff --git a/‎artisera/artisera_lighting.py ‎artisera_lighting.py b/‎artisera/artisera_lighting.py ‎artisera_lighting.py
diff --git a/‎artisera/artisera_lighting.pyc ‎artisera_lighting.pyc b/‎artisera/artisera_lighting.pyc ‎artisera_lighting.pyc
diff --git a/‎artisera/artisera_rugs.py ‎artisera_rugs.py b/‎artisera/artisera_rugs.py ‎artisera_rugs.py
diff --git a/‎artisera/artisera_rugs.pyc ‎artisera_rugs.pyc b/‎artisera/artisera_rugs.pyc ‎artisera_rugs.pyc
diff --git a/‎artisera/artisera_tableware-barware.py ‎artisera_tableware-barware.py b/‎artisera/artisera_tableware-barware.py ‎artisera_tableware-barware.py
diff --git a/‎artisera/artisera_tableware-barware.pyc ‎artisera_tableware-barware.pyc b/‎artisera/artisera_tableware-barware.pyc ‎artisera_tableware-barware.pyc
diff --git a/‎furnstyl/furnstyl.pyc
-2.14 KB b/‎furnstyl/furnstyl.pyc
-2.14 KB
diff --git a/‎greenessencestore/greenessencestore.py ‎greenessencestore.py
+3-3 b/‎greenessencestore/greenessencestore.py ‎greenessencestore.py
+3-3
diff --git a/‎greenessencestore/greenessencestore.pyc ‎greenessencestore.pyc
2.34 KB b/‎greenessencestore/greenessencestore.pyc ‎greenessencestore.pyc
2.34 KB
diff --git a/‎idamstore.py
+51 b/‎idamstore.py
+51
diff --git a/‎idamstore.pyc
2.28 KB b/‎idamstore.pyc
2.28 KB
diff --git a/‎kilishop/kilishop.py ‎kilishop.py b/‎kilishop/kilishop.py ‎kilishop.py
diff --git a/‎kilishop/kilishop.pyc ‎kilishop.pyc b/‎kilishop/kilishop.pyc ‎kilishop.pyc
diff --git a/‎lekiaan/lekiaan.py ‎lekiaan.py b/‎lekiaan/lekiaan.py ‎lekiaan.py
diff --git a/‎lekiaan/lekiaan.pyc ‎lekiaan.pyc b/‎lekiaan/lekiaan.pyc ‎lekiaan.pyc
diff --git a/‎lekiaan/lekiaan_tables.py ‎lekiaan_tables.py b/‎lekiaan/lekiaan_tables.py ‎lekiaan_tables.py
diff --git a/‎lekiaan/lekiaan_tables.pyc ‎lekiaan_tables.pyc b/‎lekiaan/lekiaan_tables.pyc ‎lekiaan_tables.pyc
diff --git a/‎lotushouse.py
+55 b/‎lotushouse.py
+55
diff --git a/‎lotushouse/lotushouse.pyc
2.54 KB b/‎lotushouse/lotushouse.pyc
2.54 KB
diff --git a/‎mudfingers.py
+51 b/‎mudfingers.py
+51
diff --git a/‎mudfingers.pyc
2.42 KB b/‎mudfingers.pyc
2.42 KB
diff --git a/‎masalaworks/mw.py ‎mw.py b/‎masalaworks/mw.py ‎mw.py
diff --git a/‎masalaworks/mw.pyc ‎mw.pyc b/‎masalaworks/mw.pyc ‎mw.pyc
diff --git a/‎olieco.py
+55 b/‎olieco.py
+55
diff --git a/‎olieco.pyc
2.34 KB b/‎olieco.pyc
2.34 KB
diff --git a/‎phantomhands/phantomhands.py ‎phantomhands.py b/‎phantomhands/phantomhands.py ‎phantomhands.py
diff --git a/‎phantomhands/phantomhands.pyc ‎phantomhands.pyc b/‎phantomhands/phantomhands.pyc ‎phantomhands.pyc
diff --git a/‎posboxin.py
+51 b/‎posboxin.py
+51
diff --git a/‎posboxin.pyc
2.62 KB b/‎posboxin.pyc
2.62 KB
@@ -0,0 +1,51 @@
+#single page crawl
+import scrapy
+import logging
+from scrapy.contrib.spiders import Rule
+from scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor
+from scrapy.selector import HtmlXPathSelector
+
+from scrapy import Request, Spider
+from scrapy.exceptions import CloseSpider
+from scrapy.selector import Selector
+
+
+from scrapy.item import Item, Field
+
+class ScrapySampleItem(Item):
+    title = Field()
+    link = Field()
+    desc = Field()
+    price =  Field()
+    image = Field()
+    
+    
+class StackOverflowSpider(scrapy.Spider): 
+
+        name = 'anhad' 
+        start_urls = ["https://www.theanhadshop.com/collections/home-textile","https://www.theanhadshop.com/collections/home-textile?page=2","https://www.theanhadshop.com/collections/home-textile?page=3","https://www.theanhadshop.com/collections/tableware"] 
+     
+		
+        def parse(self, response): 
+            for href in response.css('.ci a::attr(href)'): 
+              full_url = response.urljoin(href.extract()) 
+              logging.info(full_url)
+              yield scrapy.Request(full_url, callback=self.parse_product,dont_filter = True) 
+
+        def parse_product(self, response):
+           items = []
+           item = ScrapySampleItem()
+    
+           item['title'] =  response.css('h1::text').extract_first()
+           item['image'] =  response.css('.thumbnail::attr(src)').extract_first()
+           item['desc']  = response.css('.rte span::text').extract()
+           item['price'] = response.css('p[id="product-price"] .product-price .money::text').extract_first()
+           
+           if not item['desc']:
+               logging.info("EMPTY RECIEVED")
+               item['desc']  = response.css('h1::text').extract_first()
+           item['link']  = response.url
+           items.append(item)
+    		
+           for item in items:
+               yield item 
@@ -23,7 +23,7 @@ class ScrapySampleItem(Item):
 class StackOverflowSpider(scrapy.Spider): 
 
         name = 'green essence' 
-        start_urls = ["http://www.greenessencestore.com/Planters-depid-423-page-1.html"] 
+        start_urls = ["http://www.greenessencestore.com/Planters-depid-423-page-1.html","http://www.greenessencestore.com/Garden-Accessories-depid-431-page-1.html","http://www.greenessencestore.com/Planter-Stand---Shelves-depid-264466-page-1.html","http://www.greenessencestore.com/Wall-Pot-Holders---Brackets-depid-273823-page-1.html","http://www.greenessencestore.com/Potted-Plants-depid-16325-page-1.html"] 
 
 
         def parse(self, response): 
@@ -36,14 +36,14 @@ def parse_product(self, response):
            items = []
            item = ScrapySampleItem()
 
-           item['title'] =  map(unicode.strip, response.css('.title::text').extract())
+           item['title'] =  map(unicode.strip, response.css('.lht19::text').extract())
            item['image'] =  response.css('img[id="largeImage"]::attr(src)').extract_first()
            item['desc']  = response.css('.desc_shorttext').extract()
            item['price'] = response.css('.amt::text').extract_first()
 
            if not item['desc']:
                logging.info("EMPTY RECIEVED")
-               item['desc']  = response.css('.title::text').extract()
+               item['desc']  = response.css('.lht19::text').extract()
            item['link']  = response.url
            items.append(item)
 
 
@@ -0,0 +1,51 @@
+#single page crawl
+import scrapy
+import logging
+from scrapy.contrib.spiders import Rule
+from scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor
+from scrapy.selector import HtmlXPathSelector
+
+from scrapy import Request, Spider
+from scrapy.exceptions import CloseSpider
+from scrapy.selector import Selector
+
+
+from scrapy.item import Item, Field
+
+class ScrapySampleItem(Item):
+    title = Field()
+    link = Field()
+    desc = Field()
+    price =  Field()
+    image = Field()
+    
+    
+class StackOverflowSpider(scrapy.Spider): 
+
+        name = 'idamstore' 
+        start_urls = ["https://www.idamstore.com/collections/all?page=1","https://www.idamstore.com/collections/all?page=2","https://www.idamstore.com/collections/all?page=3"] 
+     
+		
+        def parse(self, response): 
+            for href in response.css('.ci a::attr(href)'): 
+              full_url = response.urljoin(href.extract()) 
+              logging.info(full_url)
+              yield scrapy.Request(full_url, callback=self.parse_product,dont_filter = True) 
+
+        def parse_product(self, response):
+           items = []
+           item = ScrapySampleItem()
+    
+           item['title'] =  response.css('.section-title h1::text').extract_first()
+           item['image'] =  response.css('.thumbnail::attr(src)').extract_first()
+           item['desc']  = response.css('.rte span::text').extract()
+           item['price'] = response.css('p[id="product-price"] .product-price::text').extract_first()
+           
+           if not item['desc']:
+               logging.info("EMPTY RECIEVED")
+               item['desc']  = response.css('.section-title h1::text').extract_first()
+           item['link']  = response.url
+           items.append(item)
+    		
+           for item in items:
+               yield item 
@@ -0,0 +1,55 @@
+
+import scrapy
+import logging
+from scrapy.contrib.spiders import Rule
+from scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor
+from scrapy.selector import HtmlXPathSelector
+
+from scrapy import Request, Spider
+from scrapy.exceptions import CloseSpider
+from scrapy.selector import Selector
+
+
+from scrapy.item import Item, Field
+
+class ScrapySampleItem(Item):
+    title = Field()
+    link = Field()
+    desc = Field()
+    price =  Field()
+    image = Field()
+    
+    
+class StackOverflowSpider(scrapy.Spider): 
+
+        name = 'lotushouse' 
+        start_urls = ["http://thelotushouse.com/paintings-wall-hangings.html","http://thelotushouse.com/showpieces-figurines.html","http://thelotushouse.com/fashion-accessories.html","http://thelotushouse.com/home-furnishings.html"] 
+
+
+        def parse(self, response): 
+             for href in response.css('.product-image::attr(href)'): 
+               full_url = response.urljoin(href.extract()) 
+               yield scrapy.Request(full_url, callback=self.parse_product) 
+              
+             next_page = response.css(".next::attr('href')")
+             if next_page:
+               url = response.urljoin(next_page[0].extract())
+               yield scrapy.Request(url, self.parse)
+
+        def parse_product(self, response):
+           items = []
+           item = ScrapySampleItem()
+    
+           item['title'] =  response.css('.product-name h1::text').extract_first()
+           item['image'] =  response.css('img[id="image"]::attr(src)').extract_first()
+           item['desc']  = response.css('.product-collateral').extract()
+           item['price'] = response.css('.add_to_cart .add-to-box .price_box .price-box .regular-price .price::text').extract()
+           
+           if not item['desc']:
+               logging.info("EMPTY RECIEVED")
+               item['desc']  = response.css('h1::text').extract_first()
+           item['link']  = response.url
+           items.append(item)
+    		
+           for item in items:
+               yield item 
@@ -0,0 +1,51 @@
+#single page crawl
+import scrapy
+import logging
+from scrapy.contrib.spiders import Rule
+from scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor
+from scrapy.selector import HtmlXPathSelector
+
+from scrapy import Request, Spider
+from scrapy.exceptions import CloseSpider
+from scrapy.selector import Selector
+
+
+from scrapy.item import Item, Field
+
+class ScrapySampleItem(Item):
+    title = Field()
+    link = Field()
+    desc = Field()
+    price =  Field()
+    image = Field()
+    
+    
+class StackOverflowSpider(scrapy.Spider): 
+
+        name = 'mudfingers' 
+        start_urls = ["http://www.mudfingers.com/AIR-PLANTS-depid-956101-page-1.html","http://www.mudfingers.com/COLORED-CLAYS-depid-932279-page-1.html","http://www.mudfingers.com/SUN-LOVERS-depid-421491-page-1.html","http://www.mudfingers.com/TERRARIUMS-depid-421269-page-1.html","http://www.mudfingers.com/AIR-PLANTS-depid-956101-page-1.html",] 
+     
+		
+        def parse(self, response): 
+            for href in response.css('.standard a::attr(href)'): 
+              full_url = response.urljoin(href.extract()) 
+              logging.info(full_url)
+              yield scrapy.Request(full_url, callback=self.parse_product,dont_filter = True) 
+
+        def parse_product(self, response):
+           items = []
+           item = ScrapySampleItem()
+    
+           item['title'] =  response.css('h1::text').extract_first()
+           item['image'] =  response.css('.z-product-thumbs img::attr(src)').extract_first()
+           item['desc']  = response.css('div[id="description"]').extract()
+           item['price'] = response.css('.prices .price_original span[id="price-standard"]::text').extract_first()
+           
+           if not item['desc']:
+               logging.info("EMPTY RECIEVED")
+               item['desc']  = response.css('h1::text').extract_first()
+           item['link']  = response.url
+           items.append(item)
+    		
+           for item in items:
+               yield item 
@@ -0,0 +1,55 @@
+
+import scrapy
+import logging
+from scrapy.contrib.spiders import Rule
+from scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor
+from scrapy.selector import HtmlXPathSelector
+
+from scrapy import Request, Spider
+from scrapy.exceptions import CloseSpider
+from scrapy.selector import Selector
+
+
+from scrapy.item import Item, Field
+
+class ScrapySampleItem(Item):
+    title = Field()
+    link = Field()
+    desc = Field()
+    price =  Field()
+    image = Field()
+    
+    
+class StackOverflowSpider(scrapy.Spider): 
+
+        name = 'olie' 
+        start_urls = ["http://www.olie.co.in/collections/lighting","http://www.olie.co.in/collections/cushion-covers","http://www.olie.co.in/collections/storage"] 
+
+
+        def parse(self, response): 
+             for href in response.css('.image a::attr(href)'): 
+               full_url = response.urljoin(href.extract()) 
+               yield scrapy.Request(full_url, callback=self.parse_product) 
+              
+             next_page = response.css(".next::attr('href')")
+             if next_page:
+               url = response.urljoin(next_page[0].extract())
+               yield scrapy.Request(url, self.parse)
+
+        def parse_product(self, response):
+           items = []
+           item = ScrapySampleItem()
+    
+           item['title'] =  response.css('.breadcrumb strong::text').extract_first()
+           item['image'] =  response.css('.zoomImg::attr(src)').extract()
+           item['desc']  = response.css('.description').extract()
+           item['price'] = response.css('h2[id="price-preview"] span::text').extract_first()
+           
+           if not item['desc']:
+               logging.info("EMPTY RECIEVED")
+               item['desc']  = response.css('.product-name h1::text').extract_first()
+           item['link']  = response.url
+           items.append(item)
+    		
+           for item in items:
+               yield item 
@@ -0,0 +1,51 @@
+#single page crawl
+import scrapy
+import logging
+from scrapy.contrib.spiders import Rule
+from scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor
+from scrapy.selector import HtmlXPathSelector
+
+from scrapy import Request, Spider
+from scrapy.exceptions import CloseSpider
+from scrapy.selector import Selector
+
+
+from scrapy.item import Item, Field
+
+class ScrapySampleItem(Item):
+    title = Field()
+    link = Field()
+    desc = Field()
+    price =  Field()
+    image = Field()
+    
+    
+class StackOverflowSpider(scrapy.Spider): 
+
+        name = 'postbox' 
+        start_urls = ["https://www.thepostbox.in/collections/vibrant-funky-india-cotton-cushion-covers","https://www.thepostbox.in/collections/wall-art","https://www.thepostbox.in/collections/trays-by-kalakaari-haath","https://www.thepostbox.in/collections/terracotta-mugs","https://www.thepostbox.in/collections/handpainted-blue-pottery-the-postbox","https://www.thepostbox.in/collections/coasters-cork-board-city-themes-graphic-art","https://www.thepostbox.in/collections/vibrant-printed-ceramic-mugs-the-postbox"] 
+     
+		
+        def parse(self, response): 
+            for href in response.css('.ci a::attr(href)'): 
+              full_url = response.urljoin(href.extract()) 
+              logging.info(full_url)
+              yield scrapy.Request(full_url, callback=self.parse_product,dont_filter = True) 
+
+        def parse_product(self, response):
+           items = []
+           item = ScrapySampleItem()
+    
+           item['title'] =  response.css('.section-title h1::text').extract_first()
+           item['image'] =  response.css('.main-product-image img::attr(src)').extract_first()
+           item['desc']  = response.css('.rte').extract()
+           item['price'] = response.css('.product-price .money::text').extract_first()
+           
+           if not item['desc']:
+               logging.info("EMPTY RECIEVED")
+               item['desc']  = response.css('.section-title h1::text').extract_first()
+           item['link']  = response.url
+           items.append(item)
+    		
+           for item in items:
+               yield item