php - Instagram Story Scraper PHP
问题描述
我建立了一个小的 Instagram Story Scraper,但我无法让它工作......我可能只是太累了。我已经尝试了所有方法,但我自己无法解决问题
每次我用 Wamp 运行它时,我都会遇到同样的错误
这是我的 index.php 文件
<?php
require_once('instagramStory.php');
$story = new instagram_story();
echo $story->getStory("garyvee");
?>
这是 instagramStory.php
<?php
class instagram_story{
protected function file_get_contents_curl($url){
$cookies = dirname(__FILE__)."/cookie.txt" ;
$curl = curl_init();
curl_setopt ($curl, CURLOPT_URL, $url);
curl_setopt ($curl, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt ($curl, CURLOPT_COOKIEFILE, $cookies);
curl_setopt ($curl, CURLOPT_RETURNTRANSFER, true);
$answer = curl_exec($curl);
curl_close($curl);
return $answer;
}
public function getStory($username){
$url = file_get_contents("https://www.instagram.com/$username/");
$json = '/sharedData\s=\s(.*[^\"]);<.script>/ixU';
preg_match_all($json, $url, $jsondata, PREG_SET_ORDER, 0);
$array = json_decode($jsondata[0][1], true);
$user_id = $array['entry_data']['ProfilePage']['0']['graphql']['user']['id'];
$stories = $this->file_get_contents_curl("https://www.instagram.com/graphql/query/?query_hash=de8017ee0a7c9c45ec4260733d81ea31&variables=%7B%22reel_ids%22%3A%5B%22$user_id%22%5D%2C%22tag_names%22%3A%5B%5D%2C%22location_ids%22%3A%5B%5D%2C%22highlight_reel_ids%22%3A%5B%5D%2C%22precomposed_overlay%22%3Afalse%2C%22show_story_viewer_list%22%3Atrue%2C%22story_viewer_fetch_count%22%3A50%2C%22story_viewer_cursor%22%3A%22%22%7D");
$data = json_decode($stories, true);
$stories = $data['data']['reels_media']['0']['items'];
$_story = [];
foreach ($stories as $story) {
$vid = 'video_resources';
if (!array_key_exists($vid, $story)) {
$_story [] = $story['display_url'];
} else {
$_story [] = $story['video_resources'][0]['src'];
}
}
foreach ($_story as $story) {
$check = '/mp4/m';
preg_match_all($check, $story, $matches, PREG_SET_ORDER, 0);
if (empty($matches)) {
echo "<a href=$story&dl=1><img src=$story></a>";
} else {
echo '<video width="320" height="240" controls>';
echo '<source src="' . $story . '" type="video/mp4">';
echo '</video>';
echo "<a href=$story&dl=1>Download</a>";
}
}
}
}
?>
解决方案
我正在和你检查同样的问题。显然这是因为命令“foreach”正在访问一个空数组。
我深入检查了数据,发现它$stories
是空的,因为它无法从 instagram 网站接收当前数据。
当我尝试访问由我自己的浏览器上的程序创建并记录了 ins 帐户的 URL 时,它可以工作。
所以问题是因为代码$cookies = dirname(__FILE__)."/cookie.txt" ;
找不到当前的cookies。您应该在登录 instagram 网站后复制 cookie,并将cookie.txt
文件与 .php 文件放在同一文件夹中。
推荐阅读
- macos - 终端 unix 命令发现设置模式的问题(愚蠢的问题)
- spring-integration - 尝试处理某些 RSS 提要时,Spring Integration 过早结束文件异常
- node.js - 让 node.js 应用程序从 AWS S3 存储桶中提取多个页面时遇到问题(超过 1000 个文件)
- python - OpenCV 找不到网络摄像头,但 Cheese 可以
- swift - 展开和折叠 1 个 Tableview 部分,1 行
- macos - openssl 32位mac
- elasticsearch - 遍历数组 update_by_query
- apache-kafka - 是否可以在 2 个 Kafka 主题之间动态插入流处理器?
- c# - 如何防止 MS Edge DevTools 停止 Visual Studio .NET MVC 应用程序?
- react-native - 有天赋的聊天缺少消息的“_id” - React Native